Jakie są różne typy projektowania hurtowni danych?

Hurtownie danych przechowują ogromne ilości danych do wykorzystania w wielu różnych dziedzinach. Istnieją dwa główne typy projektowania hurtowni danych: odgórne i oddolne. Te dwa projekty mają swoje wady i zalety. Implementacja oddolna jest łatwiejsza i tańsza, ale jest mniej kompletna, a korelacje danych są bardziej sporadyczne. W projekcie odgórnym połączenia między danymi są oczywiste i dobrze ugruntowane, ale dane mogą być nieaktualne, a wdrożenie systemu jest kosztowne.

Bazy danych są centralną postacią w projektowaniu hurtowni danych. Data mart to zbiór danych oparty na jednej koncepcji. Każda baza danych to unikalny i kompletny podzbiór danych. Każda z tych kolekcji jest całkowicie skorelowana wewnętrznie i często ma połączenia z zewnętrznymi bazami danych.

Sposób obsługi hurtowni danych jest główną różnicą między dwoma stylami projektowania hurtowni danych. W projekcie odgórnym zbiorcze dane występują naturalnie, gdy dane są wprowadzane do systemu. W projekcie „od dołu do góry” zbiorcze dane są tworzone bezpośrednio i łączone ze sobą w celu utworzenia magazynu. Chociaż może się to wydawać niewielką różnicą, powoduje to zupełnie inny projekt.

Metodą odgórną był pierwotny projekt hurtowni danych. Korzystając z tej metody, wszystkie informacje, które posiada organizacja, są umieszczane w systemie. Każdy szeroki temat będzie miał swój własny ogólny obszar w bazach danych. W miarę używania danych pojawią się połączenia między skorelowanymi punktami danych i pojawią się zbiorcze bazy danych. Ponadto wszelkie dane w systemie pozostają tam na zawsze — nawet jeśli zostaną zastąpione lub zbanalizowane przez późniejsze informacje, pozostaną w systemie jako zapis przeszłych zdarzeń.

Metoda oddolna projektowania hurtowni danych działa w przeciwnym kierunku. Firma umieszcza informacje jako samodzielny mart danych. W miarę upływu czasu do systemu dodawane są kolejne zestawy danych, albo jako własne bazy danych, albo jako część już istniejącego. Gdy dwie hurtownie danych są uważane za wystarczająco połączone, łączą się w jedną jednostkę.
Każdy z dwóch projektów hurtowni danych ma swoje mocne i słabe strony. Metoda odgórna to ogromny projekt dla jeszcze mniejszych zbiorów danych. Ponieważ duże projekty są również droższe, jest to najdroższe pod względem pieniędzy i siły roboczej. Jeśli hurtownia danych jest skończona i utrzymywana, jest to ogromny zbiór, zawierający wszystko, co firma wie.
Proces oddolny jest znacznie szybszy i tańszy, ale ponieważ dane są wprowadzane w miarę potrzeb, baza danych nigdy nie będzie kompletna. Ponadto korelacje między bazami danych są tak silne, jak czyni je ich użycie. Jeśli istnieje silna korelacja, ale żaden użytkownik jej nie widzi, zostaje rozłączona.