Indexarea automată este acțiunea de a folosi un program de calculator sau un algoritm pentru a parcurge fișiere, documente și site-uri web în căutarea cuvintelor cheie. Acesta poate fi folosit în programe individuale, dar este și un algoritm popular pentru motoarele de căutare, care trebuie să acceseze cu crawlere diferite site-uri web pentru a-și afla informațiile. Un avantaj al indexării automate este că computerul poate indexa și căuta cu ușurință un document mult mai rapid decât poate o persoană. Dezavantajul este că o persoană trebuie să facă indexerul și este posibil ca indexorul să rateze puncte cheie din cauza programării defectuoase.
Există multe fișiere găsite pe Internet, computere și dispozitive de stocare. Fiecare dintre aceste documente se referă de obicei la un subiect specific, iar cuvintele recurente vor dezvălui subiectul documentelor. De exemplu, un document medical va folosi de obicei termeni medicali. Un program de indexare automată va parcurge documentul și va clasifica documentul pe baza acestor cuvinte.
Unele programe individuale, cum ar fi cititoarele de documente, pot efectua indexare automată. Când vine vorba de căutarea într-o rețea locală, această caracteristică este de obicei inclusă în bazele de date care pot fi dificil de căutat manual. Cel mai popular loc pentru a găsi indexarea automată este un motor de căutare online, deoarece motorul de căutare trebuie să potrivească cuvântul cheie al utilizatorului, sau termenul de căutare, cu toate site-urile web existente. Fără această funcție, oamenii ar fi dificil să găsească site-uri web relevante.
Cel mai evident avantaj al indexării automate este că îndepărtează munca oamenilor, care nu pot scana un document la fel de repede ca un computer. De asemenea, computerul poate clasifica documentele după scanarea lor, astfel încât utilizatorii nu vor fi nevoiți să efectueze această muncă obositoare. În timp ce utilizatorii ar putea fi nevoiți să verifice organizația pentru erori, deoarece un indexator poate uneori să greșească un document, acest lucru este totuși mai ușor decât să faci totul manual.
Deși există multe avantaje, există și dezavantaje în utilizarea indexării automate. Ca și în cazul oricărui program sau algoritm, o persoană trebuie să creeze programul. Aceasta înseamnă că programatorul trebuie să-i spună indexatorului cum să împerecheze cuvintele, ceea ce poate duce la inexactități rezultate din programarea proastă. De asemenea, indexatorul poate să nu fie în măsură să deosebească anumite cuvinte sau poate avea un număr mare de inexactități din cauza cuvintelor cheie ciudate. De exemplu, un document medical care discută pericolele produselor cosmetice poate fi catalogat incorect ca document de frumusețe și machiaj.