Ce este Vocabularul controlat?

Vocabularul controlat este un concept în informatică și programare computerizată care implică utilizarea doar a unor termeni agreați anterior sau aprobați atunci când se construiesc baze de date relaționale, metadate care pot fi căutate sau alte sisteme în care cuvintele care pot fi citite de om sunt folosite pentru a marca informațiile pentru a fi recuperate ulterioare. Metodologia utilizării unui vocabular controlat pentru a clasifica informațiile este în contrast direct cu conceptul de vocabular al limbajului natural, în care nu există termeni conveniți și toate cuvintele care sunt folosite sunt în schimb legate prin relații ponderate. În plus față de cuvintele de nivel superior care sunt utilizate într-un vocabular controlat, pot fi folosite cuvinte de sprijin, astfel încât sinonimele sau alți termeni care sunt puternic asociați cu termenul de nivel superior pot declanșa utilizarea cuvântului de nivel superior. Principalele diferențe care sunt măsurate între sistemele de limbaj natural și sistemele de vocabular controlat sunt relevanța rezultatelor unei interogări folosind cuvintele, volumul de informații returnate și gradul de utilizare general al sistemului.

Există multe situații în care o colecție de cuvinte sau termeni este folosită pentru a face mai accesibile utilizatorilor informații care sunt arbitrare, în continuă schimbare sau dezorganizate. Termenii de căutare într-un motor de căutare pe Internet, o bază de date de informații corporative și chiar o bibliotecă digitală de cercetare sunt toate exemple de aplicații prin care informațiile pot fi clasificate cu termeni de metadate, spre deosebire de o structură ierarhică strictă. Cuvintele folosite pentru a descrie un obiect în astfel de situații construiesc un fel de index căutabil al fondului mai mare de informații.

Un exemplu de utilizare a vocabularului controlat poate fi văzut atunci când se ia în considerare un sistem de înregistrare pentru o companie. Fișierele trebuie clasificate astfel încât să poată fi recuperate ușor și previzibil. Dacă un fișier se referă la mașini, atunci ar putea fi depus în categoria „mașini”. Dacă o altă persoană are și un fișier care se ocupă de mașini, fără un vocabular controlat, fișierul ar putea fi plasat la rubrica „automobile”, ceea ce face ca cele două fișiere să fie dificil de găsit cu o singură căutare. Când categoriile sunt controlate, atunci toate fișierele care se ocupă de mașini vor fi plasate sub un singur titlu convenit.

Avantajul utilizării unui vocabular controlat este că informațiile sunt strict descrise într-un mod previzibil. Aceasta înseamnă că oricine cunoaște vocabularul va putea căuta informații în mod eficient și precis. O complicație cu vocabularul, totuși, este că termenii de căutare sunt mai dificil, dacă nu imposibil, de generat automat și, de obicei, necesită o intervenție umană, ceea ce face ca o sarcină mare să transforme bazele de date existente pentru a utiliza un vocabular controlat. Dacă vocabularul nu este suficient de mare, atunci există și posibilitatea ca o singură interogare să aducă un volum atât de mare de informații, încât devine imposibil de sortat fără utilizarea unei alte metode de interogare.