Co to jest model hurtowni danych?

Model hurtowni danych jest stosowaną formą modelu danych systemu komputerowego. W systemach komputerowych przepływ danych jest modelowany na podstawie informacji teoretycznych w celu sprawdzenia możliwości i ograniczeń systemu. Kiedy pojawiła się hurtownia danych, te same modele zaczęły znajdować rzeczywiste zastosowania fizyczne w konstrukcji danych. Byłoby to podobne do osoby, która po prostu rozwiązuje zadania matematyczne, a następnie używa tych równań do budowy nowego typu silnika.

Istnieje kilka różnych pomysłów na model hurtowni danych. Każdy z nich ma swoje mocne i słabe strony, a także typy danych, z którymi lepiej sobie radzi. Nie jest niczym niezwykłym, że kilka różnych modeli hurtowni danych lub systemy hybrydowe, które wykorzystują zalety wielu typów, istnieją w tym samym systemie.

System Flat to model hurtowni danych, który wielu użytkowników uznałby za najłatwiejszy. Ten sposób przechowywania danych obejmuje połączone ze sobą wiersze i kolumny informacji, podobnie jak w arkuszu kalkulacyjnym. Chociaż ta metoda jest łatwa do odczytania dla ludzi, jest trudniejsza dla komputerów i wolniejsza w korelacji.

Hierarchiczny model hurtowni danych przechowuje informacje w ciągłej serii poziomów. Każdy poziom zawiera informacje zależne od generacji powyżej. Jest to bardzo podobne do modelu sieciowego, który zawiera również szereg poziomów zależnych. Różnica polega na ich zależnościach — w systemie hierarchicznym każdy blok danych może mieć tylko jeden wyższy poziom zależności, ale w modelu sieciowym może mieć ich tyle, ile potrzebuje. W obu przypadkach pojedynczy blok informacji może łączyć się z kilkoma blokami poniżej.

Model relacyjnej hurtowni danych jest odmianą systemu Flat. Dane są przechowywane w tabelach, podobnie jak w systemie Flat, a każda podstawowa część danych otrzymuje unikalny identyfikator. Ten identyfikator podróżuje wraz z danymi, zapewniając unikalność. Na przykład, jeśli pracodawca ma dwóch pracowników o tym samym nazwisku, ich identyfikator nadal oddziela ich w systemie. Ten identyfikator jest skorelowany w całym systemie — jeśli wszystko działa poprawnie, za każdym razem, gdy coś związanego z unikalnymi informacjami wchodzi do systemu, koreluje to z wcześniej istniejącymi informacjami opartymi na samym identyfikatorze.

Model wymiarowy oparty jest na modelu hierarchicznym. Pojedynczy fakt jest używany jako punkt wyjścia, a następnie spływają z niego dodatkowe informacje dotyczące tego faktu. Element taki jak numer pracownika byłby początkowym faktem; wtedy daty związane z tym pracownikiem, a także wynagrodzenie lub czas urlopu, będą się z nim łączyć, gdy wejdą do systemu.
Modele relacyjnej i wymiarowej hurtowni danych to dwa najpopularniejsze style. Istnieją inne rodzaje hurtowni danych, ale są one niewielkie w porównaniu z nimi. Ogólnie rzecz biorąc, nowe modele są budowane z systemów płaskich, hierarchicznych lub sieciowych; często są to tylko proste ulepszenia ich podstawowej metody organizowania.

Co to jest architektura hurtowni danych?

Co to jest serwer hurtowni danych?

Jakie są różne sposoby poprawy wydajności hurtowni danych?

Jak utrzymać jakość hurtowni danych?