Coreferența este un fenomen în limbaj în care mai multe cuvinte sau fraze au același referent. Aceasta înseamnă că ambele se referă la aceeași persoană, loc, lucru sau alt substantiv aplicabil. Acest element al analizei lingvistice ajută la studierea modurilor în care este folosită limba. De asemenea, este util în studiul mai modern al procesării limbajului natural, care acționează ca fundație pentru diferite modele de computer care analizează vorbirea.
Câteva exemple simple de coreferențe îi vor ajuta pe începători să înțeleagă ce constituie acest tip de model lingvistic. De exemplu, dacă cineva spune „ai crezut că poți atinge obiectivul”, cele două instanțe ale pronumelui „tu”, ambele se referă la aceeași persoană și, prin urmare, aceasta este o formă de coreferență. În aceste exemple, cele două cuvinte nu trebuie să fie identice. De exemplu, cineva care spune: „Ioan a crezut că ar putea atinge obiectivul”, încă generează coreferință cu cuvintele „Ioan” și „el”, care, din nou, ambele se referă la aceeași persoană.
În ceea ce privește lingvistica tehnică, coreferența este un exemplu de tip de anaforă, care este un caz în care o expresie se referă la alta. Unii experți împart acest lucru în două subcategorii, unde anafora este cazul unei expresii care se referă la o expresie ulterioară, iar un alt termen, catafora, este folosit pentru o expresie care se referă la o expresie anterioară. Ca categorie de anaforă, coreferențele arată și modul în care anumite expresii, în special pronumele, pot fi destul de ambigue și necesită context pentru procesare.
Când coreferința este folosită în serviciul procesării limbajului natural, poate arăta mult diferit decât atunci când face parte dintr-un studiu general al vorbirii. Calculatoarele utilizează algoritmi foarte avansați pentru a realiza procesarea limbajului natural în toate formele sale. O logică extrem de complicată și complexă este necesară pentru a analiza vorbirea din punct de vedere tehnologic, pur și simplu pentru că atât de mult din limbaj se învârte în jurul capacității unei ființe umane de a interpreta cuvintele și frazele alteia.
Pentru a scăpa de dificultatea de a replica înțelegerea limbajului natural cu computere, designerii și dezvoltatorii ar putea folosi un concept numit rezoluție coreferență. Această tehnică permite tehnologiei să devină mai inteligentă în ceea ce privește procesarea limbajului natural, lucrând cu coreferențele într-un anumit mod. Unii experți ar descrie procesul de rezoluție a coreferenței ca un proces în care computerul etichetează toate expresiile și apoi le organizează sau le clasifică într-un rezultat coerent.