Eksploracja danych opisuje proces wydobywania danych z dużych zbiorów informacji i prezentowania ich w unikalny sposób. Proces ten często występuje w badaniach business intelligence, w których eksperci eksplorują duże zbiory danych dotyczących rynku lub działalności biznesowej i próbują odkryć wcześniej nierozpoznane relacje i trendy. Model eksploracji danych odnosi się do technik używanych przez specjalistów do grupowania i prezentowania informacji, a także do sposobów, w jakie mogą zastosować informacje do określonych pytań i problemów.
Wielu specjalistów uważa regresję eksploracji danych za najbardziej podstawowy i powszechnie stosowany model eksploracji danych. W tym procesie ekspert analizuje zestaw danych i tworzy formułę, która go opisuje. Wielu analityków finansowych używa tej techniki do prognozowania cen i trendów rynkowych. Ten model działa najlepiej w scenariuszach, w których oczekuje się, że dane pozostaną spójne.
Inny popularny model eksploracji danych oparty jest na asocjacjach. Specjalista może przeanalizować zbiory danych, aby określić, które komponenty często występują razem. Kiedy dwa składniki są wielokrotnie sparowane, badacz może założyć, że istnieje między nimi jakiś związek. Na przykład badacz, który wykorzystuje eksplorację danych, aby poznać wyniki sklepu detalicznego, może stwierdzić, że konsumenci często kupują długopisy i ołówki w tym samym czasie, w którym kupują papier. Menedżer może wykorzystać informacje uzyskane z modelu eksploracji danych, aby zwiększyć sprzedaż, wyświetlając wszystkie powiązane elementy w jednym miejscu.
Analiza czynnikowa to kolejny popularny model eksploracji danych. W tym procesie badacz gromadzi szereg różnych zmiennych i próbuje zlokalizować czynniki determinujące wahania wartości. Na przykład badacz rynku może dowiedzieć się od bazy klientów, jak ocenia cechy podobnych produktów. Badacz może następnie uporządkować te informacje, aby zilustrować czynniki, które determinują ocenę cech przez konsumentów. Chociaż zwolennicy tego modelu uważają, że może on podkreślić podobieństwo pozornie odmiennych zmiennych, niektórzy krytycy uważają, że model ten może prowadzić niektórych interpretatorów do zakładania przyczynowości pewnych zjawisk, gdy wszystkie informacje niezbędne do ustalenia związku przyczynowego mogą nie być dostępne.
W przypadku prostszych problemów badacze mogą wykorzystać model eksploracji danych oparty na kategoryzacji. Korzystając z tej techniki, specjaliści organizują dane według ich klasyfikacji i mają tendencję do organizowania ich w formie wizualnej, takiej jak drzewo lub wykres. Ten rodzaj modelu jest szczególnie pomocny w scenariuszach, w których jednostka musi wybierać spośród kilku opcji w każdej kategorii. Projektant może uznać ten model za przydatny, jeśli na każdym etapie procesu może wybrać spośród kilku materiałów.