Co to jest eksploracja danych przestrzennych?

Eksploracja danych przestrzennych to proces poszukiwania wzorców w danych geograficznych. Najczęściej stosowany w handlu detalicznym, wyrósł z dziedziny eksploracji danych, która początkowo skupiała się na wyszukiwaniu wzorców w tekstowych i numerycznych informacjach elektronicznych. Eksploracja danych przestrzennych jest uważana za bardziej skomplikowane wyzwanie niż eksploracja tradycyjna ze względu na trudności związane z analizowaniem obiektów o konkretnych istnieniach w przestrzeni i czasie.

Podobnie jak w przypadku standardowej eksploracji danych, eksploracja danych przestrzennych wykorzystywana jest przede wszystkim w świecie marketingu i handlu detalicznego. Jest to technika podejmowania decyzji o tym, gdzie otworzyć jaki sklep. Może pomóc w podejmowaniu tych decyzji poprzez przetwarzanie istniejących danych o tym, jakie czynniki motywują konsumentów do pójścia w jedno miejsce, a nie inne.

Powiedzmy, że Ashley chce otworzyć klub nocny w pewnym bloku miasta. Gdyby miała dostęp do odpowiednich danych, mogłaby wykorzystać eksplorację danych przestrzennych, aby dowiedzieć się, jakie czynniki przestrzenne sprawiają, że kluby nocne odnoszą sukcesy. Może zadawać pytania typu: Czy więcej osób przyjdzie do klubu, jeśli w pobliżu będzie transport publiczny? Jaka odległość od innych klubów nocnych maksymalizuje patronat? Czy bliskość stacji benzynowych to plus czy minus?

Ashley może również chcieć upewnić się, że ludzie, którzy przychodzą do jej klubu nocnego, przybywają równomiernie w ciągu jednej nocy. Mogłaby również wykorzystać eksplorację danych przestrzennych — być może dokładniej, eksplorację danych przestrzenno-czasowych — aby dowiedzieć się, jak ludzie poruszają się po mieście w określonych godzinach. Ten sam proces można zastosować do patronatu w różne noce tygodnia.

Trudności tej metody wynikają ze złożoności świata poza internetem. Podczas gdy wcześniejsze wysiłki w zakresie eksploracji danych zwykle miały bazy danych gotowe do analizy, dane wejściowe dostępne do eksploracji danych przestrzennych nie są siatkami informacji, ale mapami. Na tych mapach znajdują się różne typy obiektów, takie jak drogi, populacje, firmy i tak dalej.

Ustalenie, czy coś jest „bliskie” czemuś innemu, przechodzi od bycia dyskretną do zmiennej ciągłej. To znacznie zwiększa złożoność wymaganą do analizy. To niewiarygodne, że jest to jeden z prostszych typów relacji dostępnych dla kogoś, kto próbuje eksplorować dane przestrzenne.
Eksploracja danych przestrzennych również napotyka na problem fałszywych alarmów. W procesie wyszukiwania danych w poszukiwaniu relacji pojawi się wiele pozornych trendów w wyniku statystycznych fałszywych alarmów. Problem ten istnieje również w przypadku zadania eksploracji prostszej bazy danych, ale jest on wzmacniany przez ilość danych dostępnych dla eksploratora danych. Ostatecznie trend zidentyfikowany przez eksplorację danych powinien zostać potwierdzony w procesie wyjaśniania i dodatkowych badań.