Data warehouse mining este analiza informațiilor conținute în una sau mai multe baze de date pentru a face informațiile utile. Aceste baze de date, sau depozite de date, sunt un depozit central de date. Companiile reunesc informațiile pe care le colectează despre clienții lor într-un depozit de date. Odată ce informațiile au fost colectate, acestea sunt „exploatate” și sunt extrase informații utile din ea pentru a produce informații care pot ajuta compania să ia decizii de afaceri care vor crește profiturile sau vor reduce costurile. Comercianții cu amănuntul folosesc frecvent data warehouse mining pentru a analiza și a prezice comportamentul clienților lor.
De exemplu, atunci când un cumpărător merge la supermarket și îi dă casierului cardul de cumpărător frecvent, informațiile despre achizițiile sale sunt colectate și stocate în depozitul de date al companiei. Un lanț de supermarketuri va avea milioane de date despre ce cumpără oamenii, când, în ce cantități și la ce preț. Un magazin poate ști că anul trecut s-au vândut 50,000 de pachete de mazăre congelată, dar numai acele informații nu sunt deosebit de utile. Dacă exploatarea din depozitul de date dezvăluie, totuși, că 75% din acele mazăre congelată au fost vândute în lunile în care mazărea proaspătă nu era disponibilă sau că 10% din mazăre au fost vândute în cele două săptămâni care au precedat Ziua Recunoștinței, compania poate putea să folosească aceste informații pentru a-și crește vânzările anuale de mazăre congelată.
Companiile pot folosi tehnici de data warehouse mining pentru a prezice vânzările viitoare. Exploatarea datelor îi poate ajuta, de asemenea, să estimeze impactul deciziilor de stocare și prețuri. La supermarket, extragerea datelor ar putea împiedica magazinele să rămână fără mazăre congelată în cazul unei recolte slabe de mazăre proaspătă într-un anumit an.
Regresia de extragere a datelor este o tehnică de extragere a datelor care este utilizată pentru a arăta ce se poate întâmpla cu o valoare a datelor dacă ceva din ecuație este modificat. Folosind exemplul de supermarket, regresia ar prezice nivelul vânzărilor de mazăre congelată dacă mazărea proaspătă ar crește în preț. Regresia folosește date istorice și îi aplică o formulă, care prezice comportamentul viitor.
Companiile vor folosi adesea o aplicație software de exploatare a depozitului de date pentru a colecta și a-și extrage datele. Aplicarea corectă este determinată de cantitatea de date pe care o au și de tipul de analiză pe care doresc să o facă. Alegerea instrumentului corect de extragere a datelor este esențială pentru culegerea și interpretarea datelor utile.