Ce este Spatial Data Mining?

Exploatarea datelor spațiale este procesul de încercare de a găsi modele în datele geografice. Cel mai frecvent utilizat în comerțul cu amănuntul, a ieșit din domeniul extragerii de date, care sa concentrat inițial pe găsirea de modele în informațiile electronice textuale și numerice. Exploatarea datelor spațiale este considerată o provocare mai complicată decât mineritul tradițional din cauza dificultăților asociate cu analizarea obiectelor cu existențe concrete în spațiu și timp.

Ca și în cazul extragerii de date standard, extragerea datelor spațiale este utilizată în primul rând în lumea marketingului și a retailului. Este o tehnică de luare a deciziilor despre unde să deschidem ce fel de magazin. Poate ajuta la informarea acestor decizii prin prelucrarea datelor preexistente despre factorii care îi motivează pe consumatori să meargă într-un loc și nu în altul.

Spune că Ashley vrea să deschidă un club de noapte într-un anumit bloc. Dacă ar avea acces la datele corespunzătoare, ar putea folosi explorarea datelor spațiale pentru a afla ce factori spațiali fac cluburile de noapte de succes. Ea ar putea pune întrebări precum: Vor veni mai mulți oameni la club dacă transportul public este în apropiere? Ce distanță față de alte locuri de viață de noapte maximizează patronajul? Este apropierea de benzinării un plus sau un minus?

De asemenea, Ashley ar putea dori să se asigure că oamenii care vin la clubul ei de noapte ajung într-o distribuție uniformă pe parcursul unei nopți individuale. Ea ar putea folosi, de asemenea, extragerea datelor spațiale – poate mai precis, extragerea datelor spațiotemporale – pentru a afla cum se deplasează oamenii prin oraș în anumite momente. Același proces ar putea fi aplicat patronajului în diferite nopți ale săptămânii.

Dificultățile acestei metode sunt rezultatul complexității lumii dincolo de internet. În timp ce eforturile anterioare de extragere a datelor aveau de obicei baze de date pregătite pentru analiză, intrările disponibile pentru extragerea datelor spațiale nu sunt grile de informații, ci hărți. Aceste hărți au diferite tipuri de obiecte, cum ar fi drumuri, populații, afaceri și așa mai departe.

Determinarea dacă ceva este „aproape de” altceva trece de la a fi o variabilă discretă la o variabilă continuă. Acest lucru crește masiv complexitatea necesară analizei. Incredibil, acesta este unul dintre cele mai simple tipuri de relații disponibile pentru cineva care încearcă extragerea datelor spațiale.
Exploatarea datelor spațiale se confruntă și cu problema fals-pozitivelor. În procesul de căutare a datelor în căutarea relațiilor, multe tendințe aparente vor apărea ca o consecință a fals-pozitivelor statistice. Această problemă există și pentru sarcina de a extrage o bază de date mai simplă, dar este amplificată de amploarea datelor disponibile pentru minerul de date. În cele din urmă, o tendință identificată prin data mining ar trebui confirmată prin procesul de explicație și cercetări suplimentare.