Co to są narzędzia do eksploracji danych?

Narzędzia do eksploracji danych to komponenty oprogramowania i teorie, które umożliwiają użytkownikom wydobywanie informacji z danych. Narzędzia zapewniają osobom fizycznym i firmom możliwość gromadzenia dużych ilości danych i wykorzystywania ich do określania konkretnego użytkownika lub grup użytkowników. Niektóre z najczęstszych zastosowań narzędzi do eksploracji danych dotyczą marketingu, ochrony przed oszustwami i nadzoru.

Ręczne pobieranie danych istnieje od setek lat. Jednak automatyzacja eksploracji danych jest najbardziej rozpowszechniona od zarania ery komputerów. W XX wieku pojawiły się różne informatyki, które wspierały koncepcję opracowywania narzędzi do eksploracji danych. Ogólnym celem wykorzystania narzędzi jest odkrywanie ukrytych wzorców. Na przykład, jeśli firma marketingowa stwierdzi, że dana osoba odbywa comiesięczną podróż z Nowego Jorku do Los Angeles, korzystne dla tej firmy będzie ogłoszenie tej osoby szczegółów miejsca docelowego.

W branży eksploracji danych ustanowiono standardy określające parametry wykorzystania narzędzi eksploracji danych. Corocznie grupa specjalnego zainteresowania ds. odkrywania wiedzy i eksploracji danych stowarzyszenia Association for Computing Machinery (SIGKDD) organizuje spotkanie w celu ustalenia, jakie procesy są wykorzystywane. Ta sama grupa jest również odpowiedzialna za ocenę etycznych implikacji analizy danych pochodzących od osób fizycznych i firm. Dwa razy w roku wydawane jest przez grupę SIGKDD Explorations.

Najbardziej rozpowszechnionym narzędziem wykorzystywanym w eksploracji danych jest proces zwany Knowledge Discovery in Databases (KDD). KDD został opracowany w 1989 roku przez Gregory Piatetsky-Shapiro. Korzystając z tego narzędzia do eksploracji danych, użytkownicy mogą przetwarzać surowe dane, wyszukiwać dane w celu uzyskania informacji i interpretować różne wyniki w formie zarządzania informacjami.

Jedna z najważniejszych form narzędzi data mining jest wykorzystywana do walki z terroryzmem w XXI wieku. W Stanach Zjednoczonych National Research Council wykorzystuje koncepcje eksploracji wzorców i eksploracji danych w oparciu o tematy, aby zidentyfikować działalność terrorystyczną w dużej puli informacji na całym świecie. Eksploracja wzorców jest definiowana przez proces lokalizowania wzorców w dużej ilości danych. Eksploracja danych oparta na podmiotach próbuje zidentyfikować relacje między osobami. Obie techniki można również wykorzystać w ogólnej praktyce biznesowej poprzez zdefiniowanie sposobu myślenia bazy klientów i interaktywnych relacji między klientami.