Co to jest ekstrakcja wiedzy?

Ekstrakcja wiedzy to proces wykorzystywania różnych źródeł informacji do stworzenia spójnego banku wiedzy. W ramach tego podejścia ekstrakcja będzie często korzystać z szeregu źródeł zarówno ustrukturyzowanych, jak i nieustrukturyzowanych. Po pomyślnym wyodrębnieniu wiedzy uzyskuje się solidne dane, które można łatwo odczytać i zinterpretować przez dany program, umożliwiając użytkownikowi końcowemu wykorzystanie tej wiedzy formalnej do dowolnego celu, którego sobie życzy.

W procesie pozyskiwania wiedzy można wykorzystać kilka różnych źródeł. W zakresie źródeł strukturalnych dane mogą być wydobywane z różnych typów relacyjnych baz danych lub z pewnego rodzaju rozszerzalnego języka znaczników lub źródła XML. Źródła nieustrukturyzowane, takie jak obrazy, różne formy dokumentów do przetwarzania tekstu, arkusze kalkulacyjne, a nawet tekst przechwycony w programach w stylu notatnika, mogą być wykorzystywane jako część procesu wyodrębniania. Dopóki źródła są czytelne dla programu używanego do zarządzania procesem ekstrakcji wiedzy, mogą być wykorzystywane jako źródła, które rozszerzają potencjał projektu, który jest zaawansowany za pomocą ekstrakcji i umożliwiają wykorzystanie końcowej wiedzy .

Istnieje kilka typowych zastosowań, które występują podczas ekstrakcji wiedzy. Jednym z częstych przykładów jest możliwość przechwytywania danych z nieustrukturyzowanego źródła i włączania do pewnego rodzaju ustrukturyzowanego źródła wiedzy. Wyodrębnianie danych znalezionych w relacyjnych bazach danych i wykorzystywanie ich do tworzenia nowych dokumentów lub wykorzystanie dokumentów elektronicznych do importowania danych do relacyjnych baz danych to kolejny przykład na to, jak ten rodzaj ekstrakcji może przyspieszyć dzielenie się wiedzą formalną bez konieczności ręcznego wprowadzania danych który jest już dostępny z innego źródła. To ponowne wykorzystanie istniejącej wiedzy w jakimś nowym formacie jest często bardzo pomocne w wielu scenariuszach, umożliwiając wykorzystanie tej wiedzy w sposób, który mógł nie być możliwy przy istniejącym źródle. W ten sposób użytkownik może tworzyć źródła, które są idealne dla wielu różnych zastosowań, a nie tylko tych, które są istotne dla pierwotnego źródła wiedzy formalnej.

Dzięki ekstrakcji danych można skorzystać z ogromnej hurtowni danych, łatwo importując i eksportując dane, jako sposób na stworzenie nowego źródła nadającego się do określonego celu. Te nowo utworzone źródła z kolei również znajdują miejsce w hurtowni danych i mogą być ostatecznie wykorzystane do tworzenia nowych ekstrakcji, które są wykorzystywane do zaspokojenia nowszych potrzeb użytkowania. Mając to na uwadze, wyodrębnianie wiedzy może być postrzegane jako bardzo pomocne narzędzie, które pomaga w maksymalnym wykorzystaniu wszystkich dostępnych obecnie zasobów, upraszczając wiele zadań związanych z dzieleniem się tą formalną wiedzą.