Ce este integrarea semantică?

„Integrare semantică” este un termen folosit în mai multe contexte în diferite domenii ale proiectării computerelor, programarii, managementului și administrării. În general, se referă la agregarea informațiilor din una sau mai multe surse disparate în scopul creării unui sistem în care informațiile sunt organizate într-un mod care să aibă sens pentru un utilizator. Integrarea semantică se ocupă frecvent de definirea și stabilirea de conexiuni de metadate, sau relații, între diferite părți ale diferitelor surse de date, astfel încât acestea să poată fi structurate logic. Acest lucru ar putea implica crearea de conexiuni relaționale între două baze de date separate, construirea unui grafic al modului în care porțiunile diferitelor site-uri web se relaționează între ele sau integrarea datelor faptice dintr-un format arbitrar necunoscut într-o structură de înregistrare concisă. Există multe aplicații practice pentru un sistem de integrare semantică complet implementat, inclusiv biblioteci sau rețele de cercetare, algoritmi mai organici ai motoarelor de căutare care pot extrapola contextul dintr-o căutare și, în cele din urmă, prin utilizarea publicării metadatelor, integrarea fără probleme a diferitelor sisteme informatice pentru schimbul de date. .

Scopul final al integrării semantice în majoritatea cazurilor este acela de a putea asocia informațiile într-un mod dinamic. Într-un exemplu foarte simplu, aceasta ar putea însemna posibilitatea de a asocia câmpuri dintr-o bază de date cu câmpuri dintr-o altă bază de date, în ciuda faptului că nu sunt potriviri exacte, cum ar fi asocierea unui câmp numit „mărime” cu un câmp numit „înălțime”. Această asociere ar putea fi realizată prin reguli definite de utilizator care leagă în mod specific cele două, sau ar putea fi realizată cu algoritmi care compară datele numerice ale câmpurilor și determină o potrivire probabilă. Cuvintele „mărime” și „înălțime” devin apoi termeni de metadate pe care alte sisteme externe de integrare semantică le-ar putea folosi pentru a găsi informații pentru un utilizator fără a fi nevoie să știe în mod specific cum stochează datele un singur sistem.

În sistemele complexe de integrare semantică, cum ar fi cele concepute pentru cercetare, publicarea și partajarea metadatelor este o componentă cheie pentru funcționare. Metadatele pot fi colectate din documente pentru a forma structuri mari de date relaționale care pot ajuta la interogări. Acest lucru înseamnă că lucrările de cercetare pe orice subiect pot fi integrate într-un sistem care măsoară și înregistrează frecvența cuvintelor, iar acele cuvinte pot ajuta utilizatorii în căutarea de informații, permițând ca subiectele conexe să fie listate din orice sursă fără a fi nevoie de conversii specifice.

Una dintre provocările cu care se confruntă proiectanții de sisteme de integrare semantică este modul de agregare a datelor. Folosirea oamenilor pentru a clasifica și a stabili relații între datele din diverse surse poate fi consumatoare de timp și, în cele din urmă, poate fi foarte dependentă de experiențele individuale ale persoanei. Când algoritmii sunt utilizați pentru a face automat asocieri, anumite relații pot fi trecute cu vederea din cauza unor diferențe minore pe care algoritmul nu le poate rezolva. O metodă de implementare a integrării semantice la scară largă utilizează algoritmi bazați pe învățare împreună cu gestionarea regulilor bazate pe oameni și, în unele cazuri, cu luarea deciziilor umane efective în timpul procesului.