Techniki analizy danych umożliwiają naukowcom przeglądanie zebranych danych i wyciąganie wniosków lub określanie na podstawie informacji. Większość technik koncentruje się na zastosowaniu technik ilościowych do przeglądu danych. Niektóre z bardziej popularnych technik analizy danych ilościowych obejmują statystykę opisową, analizę danych eksploracyjnych i analizę danych potwierdzających. Te dwa ostatnie polegają na użyciu wsparcia lub braku wsparcia z góry ustalonej hipotezy. Grupy, które mogą korzystać z tych technik, to między innymi indywidualni badacze, studenci, firmy, agencje rządowe i aktuariusze, a także inne strony potrzebujące informacji i danych.
Ilościowa analiza danych ma na celu usunięcie stronniczości badaczy z zebranych danych. Intensywne wykorzystanie statystyk, prawdopodobieństw lub innych technik matematycznych pozwala jednostkom na stosowanie standardowych metod interpretacji danych. Kiedy badacze próbują zastosować jakościowe techniki analizy danych — często w oparciu o pochodzenie osobiste, preferencje lub podstawowe badania i zasady rozumowania — zebrane dane mogą zostać błędnie odczytane lub niewłaściwie zinterpretowane. Dlatego techniki matematyczne są mniej podatne na te błędy i często bardziej akceptowane przez inne osoby lub badaczy.
Opisowa analiza statystyczna rozdziela lub podsumowuje dane na określone grupy. Dane demograficzne to powszechny zestaw statystyk opisowych. Naukowcy będą gromadzić informacje dotyczące wieku, płci, wielkości gospodarstwa domowego, dochodów, rodzaju pracy i inne informacje. Innym rodzajem opisowej analizy statystycznej jest procent ukończenia rozgrywającego podczas gry w piłkę nożną. Jeśli rozgrywający wykona sześć z ośmiu prób podania, ma 75% ukończenia. Wadą tej techniki jest brak możliwości dostarczenia przez statystyki dodatkowych informacji, takich jak długość każdego przejścia.
Techniki eksploracyjnej analizy danych często obejmują wykorzystanie wykresów skrzynkowych, histogramów, wykresów Pareto, wykresów punktowych lub wykresu łodygi i liścia. Głównym celem tej techniki jest wsparcie wysuniętej przez badacza hipotezy. Na przykład badacz może chcieć udowodnić hipotezę dotyczącą przedziału wiekowego właścicieli, którzy jeżdżą określonym typem samochodu, takim jak minivan. Aby przetestować i poprzeć tę hipotezę, badacz zbierze informacje i stworzy wykres pudełkowy, aby określić liczbę właścicieli w podanym zakresie. Statystyki dostarczą informacji wspierających lub niewspierających hipotezę i pokażą, ile wartości odstających znajduje się w zebranych danych.
Techniki konfirmacyjnej analizy danych są przeciwieństwem technik eksploracyjnych. W tych testach badacz stara się obalić hipotezę zerową, która jest stwierdzeniem powszechnie akceptowanym jako prawdziwe przez większość osób. Aby obalić hipotezę zerową, badacz zbierze szczegółowe informacje związane z hipotezą i przetestuje średnią, wariancję, wartości p i przedziały ufności. Przedział ufności potwierdzony przez potwierdzającą analizę danych dostarczy informacji, na ile badacz powinien być pewny, czy hipoteza zerowa jest prawdziwa czy fałszywa.