Koreferencja to zjawisko w języku, w którym wiele słów lub fraz ma ten sam odniesienie. Oznacza to, że oba odnoszą się do tej samej osoby, miejsca, rzeczy lub innego odpowiedniego rzeczownika. Ten element analizy językowej pomaga badać sposoby używania języka. Jest również przydatny w bardziej nowoczesnych badaniach przetwarzania języka naturalnego, które stanowią podstawę dla różnych modeli komputerowych analizujących mowę.
Kilka prostych przykładów współreferencji pomoże początkującym zrozumieć, na czym polega ten rodzaj wzorca językowego. Na przykład, jeśli ktoś mówi „myślałeś, że możesz osiągnąć cel”, dwa wystąpienia zaimka „ty”, oba odnoszą się do tej samej osoby, a więc jest to forma odniesienia. W tych przykładach te dwa słowa nie muszą być takie same. Na przykład ktoś, kto mówi: „Jan myślał, że mógłby osiągnąć cel”, nadal generuje współodniesienie ze słowami „Jan” i „on”, które ponownie odnoszą się do tej samej osoby.
Z punktu widzenia językoznawstwa technicznego koreferencja jest przykładem pewnego rodzaju anafory, czyli przypadku, w którym jedno wyrażenie odnosi się do drugiego. Niektórzy eksperci dzielą to na dwie podkategorie, gdzie anafora jest przypadkiem wyrażenia odnoszącego się do następnego wyrażenia, a inny termin, katafora, jest używany dla wyrażenia, które odnosi się do poprzedniego wyrażenia. Jako kategoria anafory, koreferencja pokazuje również, jak pewne wyrażenia, zwłaszcza zaimki, mogą być dość niejednoznaczne i wymagają kontekstu do przetwarzania.
Kiedy koreferencja jest używana w służbie przetwarzania języka naturalnego, może wyglądać zupełnie inaczej niż wtedy, gdy jest częścią ogólnego badania mowy. Komputery wykorzystują wysoce zaawansowane algorytmy do przetwarzania języka naturalnego we wszystkich jego formach. Niezwykle skomplikowana i złożona logika jest niezbędna do analizowania mowy z technologicznego punktu widzenia, po prostu dlatego, że tak wiele języka kręci się wokół zdolności jednego człowieka do interpretowania słów i fraz drugiego.
Aby ominąć trudności z odtworzeniem zrozumienia języka naturalnego za pomocą komputerów, projektanci i programiści mogą użyć koncepcji zwanej rozwiązywaniem rdzeni. Technika ta pozwala technologii stać się bardziej inteligentną pod względem przetwarzania języka naturalnego poprzez pracę z korelacjami w określony sposób. Niektórzy eksperci opisaliby proces rozwiązywania współreferencji jako proces, w którym komputer etykietuje wszystkie wyrażenia, a następnie organizuje lub kategoryzuje je w jakiś spójny wynik.