Miningul web este o formă de recoltare de informații care se aplică datelor culese din surse online. Colectarea de date din surse de pe Internet permite utilizatorilor să agrega volume mari de informații pentru analiză pentru a lua decizii cheie de afaceri într-un mediu online. De exemplu, un cercetător ar putea folosi web mining pentru a colecta informații cu privire la utilizarea anumitor cuvinte cheie în conținutul web. În mod alternativ, comercianții cu amănuntul și alți profesioniști în marketing folosesc extragerea de date online pentru a identifica tendințele în traficul web, conversia vizitatorilor site-ului în cumpărători și alte utilizări web.
În ceea ce privește colectarea, sortarea și analiza datelor, web mining imită activitățile tradiționale de data mining. Comparativ, activitățile de web mining se concentrează pe informații bazate pe web, mai degrabă decât pe o secțiune transversală mare de surse de informații, cum ar fi bazele de date computerizate offline, înregistrările clienților sau datele contabile pe hârtie, așa cum se întâmplă de obicei cu extragerea de date tradițională. Concentrarea exclusiv pe colectarea datelor din surse online oferă o analiză țintită necesară pentru strategiile de marketing online, deciziile privind structura site-ului web și luarea deciziilor similare legate de comerțul electronic. Colectarea datelor prin web mining oferă, de asemenea, beneficiul suplimentar al unui larg demografie internațională, deoarece site-urile web din întreaga lume sunt disponibile cercetătorilor și colectorilor de informații.
Din punct de vedere profesional, web mining este împărțit în trei categorii specifice: extragerea structurii web, minarea utilizării și extragerea conținutului web. Fiecare zonă se concentrează pe informații specifice, cum ar fi structura și hyperlinkurile unui anumit site web, informațiile din jurnalul de server cu privire la utilizarea vizitatorilor și conținutul specific disponibil online. Pachetele și serviciile de software de analiză a site-urilor web sunt un prim exemplu de extragere a utilizării web, oferind webmasterilor informații despre traficul vizitatorilor, rezultatele căutării utilizate, linkurile pe care s-a făcut clic și timpul petrecut interacționând cu anumite pagini. Structure mining, pe de altă parte, oferă informații detaliate despre structura internă a unui site web specific, inclusiv hyperlinkuri, baze de date și funcții de interogare.
Pentru profesioniștii în marketing, web miningul oferă o multitudine de utilizări în raport cu activitățile de marketing. Cunoașterea modului în care vizitatorii site-ului folosesc un anumit site web, a modului în care concurenții creează un site concurent și ce conținut este deja online este o informație valoroasă. Astfel de informații îi ajută pe factorii de decizie cheie să elaboreze o strategie de marketing bazată pe tehnici dovedite anterior și pe informații documentate.
Colegiile și universitățile folosesc, de asemenea, web mining prin intermediul unui software care verifică că lucrările studenților sunt unice și nu sunt plagiate. Folosind principiile de extragere a conținutului web, astfel de ajutoare de clasificare caută pe întregul Internet conținut similar. Instructorii încarcă textul unui document al studentului și apoi instruiesc software-ul de plagiat să verifice pe Internet fraze similare sau text copiat online. Rezultatele sunt adesea exprimate ca procent din textul potrivit. Sunt furnizate link-uri către orice rezultate similare pentru a permite instructorilor posibilitatea de a vizita site-uri pentru a determina dacă potrivirile sunt într-adevăr plagiate.