Co to jest integracja semantyczna?

„Integracja semantyczna” to termin używany w kilku kontekstach w różnych obszarach projektowania komputerów, programowania, zarządzania i administracji. Ogólnie odnosi się do agregowania informacji z jednego lub większej liczby różnych źródeł w celu stworzenia systemu, w którym informacje są zorganizowane w sposób zrozumiały dla użytkownika. Integracja semantyczna często zajmuje się definiowaniem i ustanawianiem połączeń metadanych lub relacji między różnymi częściami różnych źródeł danych, dzięki czemu można je logicznie ustrukturyzować. Może to obejmować tworzenie relacji relacyjnych między dwiema oddzielnymi bazami danych, budowanie wykresu przedstawiającego wzajemne relacje między częściami różnych witryn internetowych lub integrowanie danych faktycznych z nieznanego, dowolnego formatu w zwięzłą strukturę rekordów. Istnieje wiele praktycznych zastosowań w pełni zaimplementowanego systemu integracji semantycznej, w tym biblioteki lub sieci badawcze, bardziej organiczne algorytmy wyszukiwarek, które mogą ekstrapolować kontekst z wyszukiwania, a ostatecznie — dzięki wykorzystaniu publikowania metadanych — bezproblemową integrację różnych systemów komputerowych do wymiany danych .

Ostatecznym celem integracji semantycznej w większości przypadków jest możliwość dynamicznego kojarzenia informacji. W bardzo prostym przykładzie może to oznaczać możliwość powiązania pól w jednej bazie danych z polami w innej bazie danych, mimo że nie są one dokładnymi dopasowaniami, takimi jak powiązanie pola o nazwie „rozmiar” z polem o nazwie „wysokość”. To powiązanie może być wykonane za pomocą zdefiniowanych przez użytkownika reguł, które konkretnie łączą te dwa lub może to być wykonane za pomocą algorytmów, które porównują dane liczbowe pól i określają prawdopodobne dopasowanie. Słowa „rozmiar” i „wysokość” stają się terminami metadanymi, których inne zewnętrzne systemy integracji semantycznej mogą być w stanie wykorzystać do znalezienia informacji dla użytkownika, bez konieczności szczegółowej znajomości sposobu przechowywania danych w pojedynczym systemie.

W złożonych systemach integracji semantycznej, takich jak te przeznaczone do badań, publikacja i udostępnianie metadanych jest kluczowym elementem działania. Metadane można pobierać z dokumentów w celu utworzenia dużych relacyjnych struktur danych, które mogą pomóc w zapytaniach. Oznacza to, że prace badawcze na dowolny temat można zintegrować z systemem, który mierzy i rejestruje częstotliwość słów, a te słowa mogą pomóc w wyszukiwaniu informacji przez użytkowników, umożliwiając wyświetlanie powiązanych tematów z dowolnego źródła bez konieczności wykonywania określonych konwersji.

Jednym z wyzwań stojących przed projektantami systemów integracji semantycznej jest sposób agregowania danych. Wykorzystywanie ludzi do klasyfikowania i tworzenia relacji między danymi z różnych źródeł może być czasochłonne i ostatecznie bardzo zależne od indywidualnych doświadczeń danej osoby. Kiedy algorytmy są używane do automatycznego tworzenia skojarzeń, niektóre relacje mogą zostać przeoczone z powodu niewielkiej różnicy, której algorytm nie jest w stanie rozwiązać. Metoda implementacji integracji semantycznej na dużą skalę wykorzystuje algorytmy oparte na uczeniu się w połączeniu z zarządzaniem regułami opartymi na ludziach oraz, w niektórych przypadkach, faktycznym podejmowaniem decyzji przez człowieka podczas procesu.