Co to jest lingwistyka korpusowa?

Językoznawstwo korpusowe nauka języka na przykładach z życia wziętych. Nie jest to gałąź językoznawstwa, ale metodologia czy podejście. Corpus, łacińskie słowo oznaczające „ciało”, odnosi się do korpusu tekstów naturalnych, a podejście polega na odkrywaniu wzorców użycia języka poprzez analizę korpusu. Językoznawstwo korpusowe przeżywa swój powrót, ponieważ programy komputerowe zrewolucjonizowały to podejście.

Pamiętniki rodzicielskie z mową dziecka, gdy po raz pierwszy przyswajają język, są prostym przykładem korpusu, który można następnie studiować, aby nauczyć się wzorców językowych. Nauczanie języków obcych w pierwszej połowie XX wieku często wykorzystywało korpusy języka docelowego do tworzenia list słownictwa dla uczniów. Wybitny językoznawca Noam Chomsky nie uważał użycia korpusów za ważne narzędzie, ponieważ uważał, że kompetencja językowa jest ważniejsza niż dane dotyczące wydajności. Wczesna lingwistyka korpusowa opierała się w dużej mierze na założeniu, że w języku naturalnym istnieje ograniczona liczba zdań i że zdania te można gromadzić i oceniać.

Po wypadnięciu z łask w latach 60. i 70. lingwistyka korpusowa przeżywa renesans dzięki metodologicznemu wykorzystaniu komputera. Program konkordancyjny to nazwa oprogramowania najczęściej używanego przez językoznawców. Podczas gdy wyszukiwanie wzorców w korpusie milionów słów zajęłoby człowiekowi zbyt dużo czasu, a wyniki byłyby mniej niż dokładne, komputer może wyszukiwać i pobierać informacje w ciągu zaledwie kilku sekund. Potrafi obliczać częstotliwość, sortować dane i wykorzystywać korpusy w sposób, który w przeszłości był niemożliwy.

Analiza oparta na korpusie może zbadać, w jaki sposób rejestr wpływa na język; wzorce użycia języka, takie jak sposób, w jaki mężczyźni i kobiety w różny sposób wykorzystują pytania ze znacznikami; zakres, w jakim wykorzystywane są wzorce językowe; oraz czynniki wpływające na zmienność użycia języka. Nauczanie może skorzystać z lingwistyki korpusowej w projektowaniu programu nauczania, opracowywaniu użytych materiałów i rodzaju ćwiczeń stosowanych w klasie. Uczniowie mogliby skorzystać na tym podejściu dzięki możliwości dokładniejszego określenia różnych zastosowań i znaczeń powszechnych słów, różnic nieodłącznie związanych z językiem pisanym i mówionym oraz zwrotów i kolokacji, z których mogliby skorzystać. Korpus danych, który jest korpusem, jest stale aktualizowany i jest produktem rzeczywistych interakcji społecznych. Tak więc korpusy są naturalistycznymi danymi, do których można łatwo uzyskać dostęp, a wyniki można uogólnić.