Algoritmii de extragere a datelor sunt interogări programate și programe utilizate pentru a identifica modele și tendințe în seturile de date. Utilizarea principală a data mining este de a determina nevoile și preferințele clienților, pe baza activității lor reale. Deși informațiile se bazează pe performanța trecută, pot fi un indicator excelent al comportamentului și tendințelor clienților.
Două exemple excelente de algoritmi de extragere a datelor sunt predictorii de grupare și cel mai apropiat vecin. Clustering este un termen folosit pentru a descrie o activitate în care unitățile individuale sau datele împărtășesc atribute importante. Separarea rufelor este un exemplu logic al acestui comportament. Persoana care sortează rufele funcționează ca algoritm. El sau ea separă rufele în grămezi după atribute: culorile, curățarea chimică și albul sunt toate separate.
Procesul propriu-zis de luare a deciziilor implicat în această activitate este detaliile algoritmului. În primul rând, setul de date trebuie limitat la elemente relevante pentru exercițiu. Pantofii nu sunt incluși în sortarea rufelor, deși pot fi în același spațiu fizic. Decizia trebuie luată în prealabil cu privire la ce caracteristici vor fi folosite pentru a separa rufele și dimensiunea fiecărei grămezi.
Predictorul celui mai apropiat vecin se bazează pe identificarea exemplelor care se potrivesc. Criteriile trebuie furnizate în etapele inițiale, specificând care este articolul sau datele și ce va include definiția celui mai apropiat. Acest tip de algoritm urmează un model similar procesului de gândire logică.
Avantajul principal al algoritmilor de extragere a datelor este capacitatea programului de a crea și identifica modele într-un volum mare de date. Abilitatea de a identifica vecinii într-un anumit cadru este ușor de realizat într-un grup mic. Cu toate acestea, datele culese din toate tranzacțiile de vânzare încheiate în cursul anului sau într-un district necesită programe speciale și o logică pentru a face cu orice precizie.
Oamenii care pot crea algoritmi de data mining pentru a satisface nevoile utilizatorilor lucrează în business intelligence sau data mining. Aceasta este o extindere foarte complexă a statisticilor care crește în popularitate, deoarece organizațiile încearcă să obțină un profit mai tangibil din datele pe care le-au colectat. Un dezvoltator eficient poate crea un set de algoritmi de extragere a datelor care identifică cu precizie modelele de comportament și poate utiliza aceste informații pentru a prezice acțiuni viitoare. Aceste informații sunt foarte valoroase pentru afaceri, organizații și guverne.