Ce este un model de data mining?

Data mining descrie procesul de extragere a datelor din seturi mari de informații și de prezentare a acestora într-un mod unic. Acest proces se găsește adesea în studiile de business intelligence, în care experții extrag seturi mari de date privind o piață sau operațiunile unei afaceri și încearcă să descopere relații și tendințe nerecunoscute anterior. Un model de data mining se referă la tehnicile pe care specialiștii le folosesc pentru a grupa și prezenta informații, precum și la modalitățile în care pot aplica informațiile la anumite întrebări și probleme.

Mulți specialiști consideră regresia data mining cel mai de bază și cel mai frecvent utilizat model de data mining. În acest proces, un expert analizează un set de date și creează o formulă care îl descrie. Mulți analiști financiari folosesc această tehnică pentru a face predicții cu privire la prețuri și tendințele pieței. Acest model funcționează cel mai bine în scenariile în care se așteaptă ca datele să rămână consistente.

Un alt model popular de data mining se bazează pe asociere. Un specialist poate analiza seturi de date pentru a determina ce componente apar adesea împreună. Când două componente sunt împerecheate din nou și din nou, un cercetător poate presupune că există o asociere între ele. De exemplu, un cercetător care folosește data mining pentru a afla despre performanța unui magazin cu amănuntul ar putea descoperi că consumatorii cumpără adesea pixuri și creioane în același timp cu care achiziționează hârtie. Un manager poate folosi informațiile învățate dintr-un model de data mining pentru a crește vânzările prin afișarea tuturor articolelor asociate într-un singur spațiu.

Analiza factorială este un alt model comun de data mining. În acest proces, un cercetător adună o serie de variabile diferite și încearcă să localizeze factorii care determină fluctuațiile valorii. Un cercetător de piață, de exemplu, poate afla de la o bază de clienți cum evaluează caracteristicile produselor similare. Un cercetător poate organiza apoi aceste informații pentru a ilustra factorii care determină evaluarea caracteristicilor de către consumatori. În timp ce susținătorii acestui model cred că poate evidenția comunitatea între variabilele aparent disparate, unii critici cred că acest model poate determina unii interpreți să presupună cauzalitatea anumitor fenomene atunci când toate informațiile necesare pentru determinarea cauzalității ar putea să nu fie disponibile.

Cercetătorii pot folosi un model de extragere a datelor bazat pe clasificare pentru probleme mai simple. Folosind această tehnică, specialiștii organizează datele după clasificările lor și tind să le organizeze într-o formă vizuală, cum ar fi într-un arbore sau o diagramă. Acest tip de model este deosebit de util în scenariile în care un individ trebuie să aleagă dintre mai multe opțiuni din fiecare categorie. Un designer ar putea găsi acest model util dacă în fiecare pas al unui proces el sau ea poate alege dintre mai multe materiale.