Co to jest oprogramowanie hurtowni danych?

Oprogramowanie hurtowni danych rozrosło się wykładniczo w ciągu ostatnich kilku lat i oczekuje się, że w przyszłości nastąpi wzrost powyżej średniej. Hurtownia danych to repozytorium wszystkich danych transakcyjnych organizacji lub firmy. Podstawowym celem hurtowni danych jest analiza transakcji i uruchamianie złożonych raportów.

Każdy produkt oprogramowania hurtowni danych ma trzy podstawowe funkcje: wyodrębnianie danych, tworzenie struktury bazy danych i tworzenie niestandardowych zapytań. W branży informatycznej eksperci od hurtowni danych są znani jako specjaliści od wywiadu biznesowego. Zazwyczaj mają doświadczenie w matematyce, statystyce lub analizie systemów komputerowych. Często wymagane jest dodatkowe szkolenie w zakresie relacyjnych baz danych, architektury systemu oraz podstaw programowania baz danych.

Jedną z najważniejszych funkcji każdego oprogramowania hurtowni danych jest możliwość prawidłowego wyodrębniania i strukturyzowania danych z różnych źródeł. Jest to często nazywane narzędziem wyodrębniania, przekształcania i ładowania (ETL). Hurtownie danych muszą być wypełnione danymi z systemu transakcyjnego w sposób, który zapewnia integralność i wzajemne powiązania danych, jednocześnie umożliwiając personelowi dostosowanie wyodrębnianych danych. Jest to zasadnicza część architektury systemu.

Należy zauważyć, że większość programów do hurtowni danych służy do tworzenia, obsługi i utrzymywania wielu zestawów danych. W wielu sytuacjach niektóre tabele są zduplikowane we wszystkich kostkach, podczas gdy istnieją inne zestawy danych, które muszą pozostać oddzielne i odrębne. Na przykład kostka danych z danymi zakupów będzie miała wiele wspólnych punktów danych z kostką płatności dostawcy. Jednak w każdej kostce będzie również szereg konkretnych informacji, które dotyczą tylko tej konkretnej kostki.

Architekt danych jest odpowiedzialny za identyfikację udostępnionych danych, potwierdzenie ich poprawności i udostępnienie tych informacji w wielu kostkach bez wpływu na integralność każdej kostki. Ponadto odpowiada za zarządzanie procesem przesyłania danych wymaganych do odświeżania kostek danych. Może to być proces zautomatyzowany lub ręczny, w zależności od złożoności kostek i sposobu dostarczania danych.
Wszystkie programy do hurtowni danych zawierają szereg standardowych raportów i zapytań. Raporty te są oparte na powszechnych potrzebach biznesowych i zwykle mają dość ogólny charakter. Na przykład raport dziesięciu największych klientów według wielkości sprzedaży za bieżący rok jest powszechnym żądaniem raportu i będzie standardem w większości programów.
Jednak wiele firm uważa, że ​​wymaga tworzenia niestandardowych raportów, aby spełnić określone potrzeby. Na przykład ten sam raport sprzedaży może wymagać uwzględnienia nazwisk przedstawicieli handlowych i posortowania danych w ramach określonych okręgów lub terytoriów. Możliwość szybkiego stworzenia niestandardowego raportu i dostosowania go do istniejących potrzeb biznesowych ma kluczowe znaczenie dla sukcesu tego typu oprogramowania.