Concept mining este un proces care se concentrează pe extragerea ideilor și conceptelor găsite în documente. Abordarea este oarecum similară text mining, diferența principală fiind că extragerea unui text se concentrează mai degrabă pe extragerea de informații decât pe idei. Concept mining este util într-o serie de aplicații, inclusiv evaluarea programelor software și în diverse aplicații care sunt în general clasificate ca parte a disciplinei inteligenței artificiale în domeniul informaticii.
Utilizarea concept mining poate avea loc cu orice tip de documente, indiferent de modul în care sunt formatate. Această strategie va funcționa bine cu documente mai mici, dar este mai ales eficientă cu documente mai lungi, deoarece ideile pot fi extrase pe parcursul documentului. Acest lucru este în contrast cu extragerea unor secțiuni specifice de text, mai ales dacă cuvintele incluse în secțiunea extrasă ar putea lua semnificații diferite în funcție de contextul utilizării. Deoarece concept mining ia în considerare întregul text ca întreg, capacitatea de a culege intenția și sensul pe baza fluxului general al documentului crește.
Aplicațiile reale ale concept mining includ capacitatea de a scana mai multe documente conținute într-o bază de date a companiei și de a le raporta la baza conceptelor găsite în documente similare. Acest lucru ajută la realizarea capacității de a face referințe încrucișate unui număr mare de documente în moduri care nu sunt posibile utilizând un text mining sau alte forme de data mining. Nu este neobișnuit ca companiile să folosească această abordare împreună cu alte strategii pentru a organiza cele mai eficiente și cuprinzătoare procese de accesare a documentelor aferente cu un minim de întârziere.
În timp ce ideea de concept mining există de zeci de ani, acest proces a devenit din ce în ce mai important, deoarece companiile și instituțiile de toate dimensiunile și tipurile se bazează mai mult pe date electronice decât pe documente pe hârtie. În acest scop, dezvoltarea de aplicaţii software care pot fi personalizate pentru a permite relaţionarea diferitelor documente din punct de vedere conceptual a devenit, de asemenea, mai frecventă. Majoritatea acestor programe software sunt configurate pentru a permite un anumit grad de activitate intuitivă ca mijloc de identificare a conceptelor găsite cu text și de a găsi conexiuni logice cu alte documente. Atunci când conceptul mining este gestionat eficient, această abordare a organizării și regăsării documentelor poate îmbunătăți considerabil capacitatea de a folosi cât mai mult documentele păstrate în depozit și de a face recuperarea ideilor, precum și a sarcinilor relevante mult mai rapidă și mai ușoară.