Ce este extragerea de cunoștințe?

Extragerea cunoștințelor este procesul de utilizare a diverselor surse de informații pentru a crea o bancă de cunoștințe coezive. Ca parte a acestei abordări, extracția se va baza adesea pe o serie de surse atât structurate, cât și nestructurate. Atunci când extragerea de cunoștințe are succes, rezultă date solide care pot fi citite și interpretate cu ușurință de un program dat, permițând utilizatorului final să utilizeze acele cunoștințe formale în orice scop dorește.

Mai multe surse diferite pot fi utilizate în procesul de extragere a cunoștințelor. În domeniul surselor structurate, datele pot fi extrase din diferite tipuri de baze de date relaționale sau din anumite tipuri de limbaj de marcare extensibil sau surse XML. Sursele nestructurate, cum ar fi imaginile, diferitele forme de documente de procesare a textului, foile de calcul și chiar textul capturat în programele de tip notepad pot fi utilizate ca parte a procesului de extracție. Atâta timp cât sursele sunt lizibile pentru programul utilizat pentru a gestiona procesul de extragere a cunoștințelor, ele pot fi folosite ca surse care extind potențialul proiectului care este avansat prin extracție și permit utilizarea cunoştinţelor finale produse. .

Există mai multe aplicații comune care apar cu extragerea cunoștințelor. Un exemplu frecvent este capacitatea de a capta date dintr-o sursă nestructurată și de a le încorpora într-un tip de sursă structurată de cunoștințe. Extragerea datelor găsite în bazele de date relaționale și utilizarea acestora pentru a crea noi documente sau utilizarea documentelor electronice pentru a importa date în bazele de date relaționale este un alt exemplu al modului în care acest tip de extracție poate accelera partajarea cunoștințelor formale fără a fi nevoie de introducerea manuală a datelor. care este deja disponibil dintr-o altă sursă. Această reutilizare a cunoștințelor existente într-un format nou este adesea foarte utilă într-o serie de scenarii, făcând posibilă utilizarea acestor cunoștințe în moduri care ar fi putut să nu fi fost posibile cu sursa existentă. În acest mod, utilizatorul poate crea surse care sunt ideale pentru o serie de aplicații diferite, mai degrabă decât cele relevante pentru originea originală a cunoștințelor formale.

Cu ajutorul extragerii de date, este posibil să folosiți un depozit de date vast, importând și exportând cu ușurință date ca o modalitate de a crea o nouă sursă care poate fi utilizată pentru un anumit scop. Aceste surse nou create, la rândul lor, își găsesc un loc în depozitul de date și pot fi utilizate în cele din urmă la crearea de noi extracții care sunt folosite pentru a satisface nevoile de utilizare mai noi. Având în vedere acest lucru, extragerea cunoștințelor poate fi văzută ca un instrument foarte util care ajută la valorificarea la maximum a tuturor resurselor disponibile în prezent, simplificând multe dintre sarcinile implicate în partajarea cunoștințelor formale.