Ce este un proiect de data mining?

Un proiect de data mining este de obicei inițiat de managerii de afaceri sau analiști. Scopul extragerii datelor este de a identifica modele sau tendințe în seturi mari de date. De exemplu, un proiect de data mining în tendințele de cumpărare ale clienților poate ajuta la informarea procesului de luare a deciziilor privind lansarea unui nou produs, preferințele clienților și prioritățile.

Fiecare proiect de data mining necesită o combinație de personal dintr-o serie de domenii diferite din cadrul organizației. Managerul de proiect este de obicei o persoană cu experiență în instrumente de business intelligence, data mining și suport pentru depozitul de date. Experții în domeniu sunt recrutați din diferitele domenii de practică din cadrul organizației. De exemplu, personalul din marketing, vânzări și conturi de încasat ar adăuga valoare proiectului. Personalul din tehnologia informației inclus în proiect ar include analiști de sisteme și de afaceri.

Există două cerințe principale pentru a susține un proiect de data mining: software și setul de abilități. Există o gamă largă de software de business intelligence care oferă instrumentele necesare pentru a susține data mining. În general, datele tranzacționale trebuie identificate și mutate în depozitul de date. Odată ce structura bazei de date relaționale a fost creată, instrumentele de extragere a datelor sunt utilizate pentru a crea interogări personalizate, cuburi de date și rapoarte.

Personalul care lucrează la un proiect de data mining necesită abilități în statistică, tehnologia informației, managementul datelor și probleme de integritate a datelor. Software-ul utilizat în acest tip de proiect este foarte complex, iar instruirea utilizatorilor este necesară pentru a utiliza funcționalitatea oferită. Pentru multe organizații, costurile asociate cu un proiect de data mining trebuie măsurate cu atenție în raport cu posibilele beneficii ale acestei tehnologii.

Există patru etape într-un proiect de data mining: un document de cerințe, definirea specificațiilor utilizatorului, implementarea bazei de date și scrierea de interogări și rapoarte. Documentul de cerințe este creat de managerul de proiect, pe baza discuțiilor cu sponsorul proiectului. Scopul acestui document este de a preciza în mod clar domeniul de aplicare al proiectului, resursele, calendarul și data livrării. Este foarte frecvent să se solicite semnături de la sponsorul proiectului și de la nivelul executiv pentru a se asigura că managementul superior a aprobat proiectul.
Specificațiile utilizatorului sunt adesea create de o echipă de analiști de afaceri și utilizatori finali. Acest proces necesită de obicei o serie de întâlniri, revizuirea documentației și editare. Cu cât procesul este mai colaborativ, cu atât rezultatele finale vor fi mai satisfăcătoare. Lucrul împreună are ca rezultat o înțelegere extinsă a perspectivei utilizatorilor de către analiștii de afaceri.
Specificațiile și documentul cerințelor sunt furnizate echipei de sistem de business intelligence, care este responsabilă de crearea structurii bazei de date, extragerea datelor necesare și colaborarea cu alți membri ai echipei pentru a configura infrastructura necesară pentru a susține această inițiativă. Acest aspect al proiectului necesită timp, software și hardware. În multe organizații, o analiză cost-beneficiu este prezentată sponsorului proiectului în această etapă, astfel încât finanțarea să poată fi asigurată.
Interogările și rapoartele reale se bazează pe nevoile utilizatorilor și trebuie testate de analiștii de afaceri înainte de implementare. Priviți funcțiile de bază ale afacerii și rapoartele curente pentru a vedea ce informații sunt necesare și pentru a determina dacă data mining este un instrument adecvat pentru a răspunde acestei nevoi.