Skip navigation

10.6. Adatbázisok

A különféle adatbázisok a korpusznyelvészet alapjául szolgálnak, s ennek nagymértékű fejlődését láthatjuk a számítógépek megjelenése, fejlődése óta. A korpusz egyfajta gyűjtemény, mely meghatározott szempontok szerint van összeválogatva. Ezeket különböző célokkal hozzák létre, így ezek különféle kutatásokban használhatók, pl. telefonos beszélgetéseket rögzítettek, vagy éppen spontán beszédet, s ezeket a produktumokat elemzik az adott célnak megfelelően. Magyar nyelvre a Magyar Nemzeti Szövegtár elérhető korpusz, mely nagyméretű, írott anyag alapján készült adatbázis. Álljon itt a Nyelvtudomány Intézet honlapján olvasható definíció:

„A korpusz ténylegesen előforduló írott, vagy lejegyzett beszélt nyelvi adatok gyűjteménye. A szövegeket valamilyen szempont szerint válogatják és rendezik. Nem feltétlenül egész szövegeket tartalmaz, és nem csak tárháza a szövegeknek, hanem tartalmazza azok bibliográfiai adatait, bejelöli a szerkezeti egységeket (bekezdés, mondat). Az MNSZ a mai magyar írott köznyelv általános célú reprezentatív korpusza kíván lenni.” (http://corpus.nytud.hu/mnsz/)