Instrumentele de extragere a datelor sunt componente software și teorii care permit utilizatorilor să extragă informații din date. Instrumentele oferă persoanelor fizice și companiilor capacitatea de a colecta cantități mari de date și de a le utiliza pentru a lua decizii cu privire la un anumit utilizator sau grupuri de utilizatori. Unele dintre cele mai frecvente utilizări ale instrumentelor de extragere a datelor sunt în domeniile marketingului, protecției împotriva fraudei și supravegherii.
Extragerea manuală a datelor există de sute de ani. Cu toate acestea, automatizarea extragerii de date a fost cea mai răspândită încă de la începutul erei computerelor. În timpul secolului al XX-lea, au apărut diverse științe informatice pentru a sprijini conceptul de dezvoltare a instrumentelor de extragere a datelor. Scopul general al utilizării instrumentelor este de a descoperi tipare ascunse. De exemplu, dacă o companie de marketing constată că o persoană face o călătorie lunară din New York City la Los Angeles, devine benefic pentru acea companie să facă publicitate persoanei cu detalii despre destinație.
În cadrul industriei de data mining, au fost stabilite standarde pentru a defini parametrii de utilizare a instrumentelor de data mining. Anual, Grupul de interes special al Asociației pentru mașini de calcul pentru descoperirea cunoștințelor și extragerea datelor (SIGKDD) ține o întâlnire pentru a determina ce procese sunt utilizate. Același grup este, de asemenea, responsabil pentru evaluarea implicațiilor etice ale analizei datelor de la indivizi și companii. Un jurnal bianual este publicat de grupul intitulat SIGKDD Explorations.
Cel mai răspândit instrument folosit în miningul de date este procesul numit Knowledge Discovery in Databases (KDD). KDD a fost dezvoltat în 1989 de Gregory Piatetsky-Shapiro. Folosind acest instrument de extragere a datelor, utilizatorii sunt capabili să proceseze date brute, să extragă datele pentru informații și să interpreteze diferitele rezultate sub formă de management al informațiilor.
Una dintre cele mai importante forme de instrumente de extragere a datelor este folosită pentru combaterea terorismului în secolul XXI. În Statele Unite, Consiliul Național de Cercetare folosește conceptele de extragere a modelelor și extragerea datelor bazate pe subiecte pentru a identifica activitățile teroriste în marele fond de informații din întreaga lume. Exploatarea modelelor este definită de procesul de localizare a modelelor într-un volum mare de date. Exploatarea datelor bazată pe subiect încearcă să identifice relațiile dintre indivizi. Ambele tehnici pot fi, de asemenea, utilizate în practica generală de afaceri prin definirea mentalității unei baze de clienți și a relației interactive dintre clienți.