Model hurtowni danych jest stosowaną formą modelu danych systemu komputerowego. W systemach komputerowych przepływ danych jest modelowany na podstawie informacji teoretycznych w celu sprawdzenia możliwości i ograniczeń systemu. Kiedy pojawiła się hurtownia danych, te same modele zaczęły znajdować rzeczywiste zastosowania fizyczne w konstrukcji danych. Byłoby to podobne do osoby, która po prostu rozwiązuje zadania matematyczne, a następnie używa tych równań do budowy nowego typu silnika.
Istnieje kilka różnych pomysłów na model hurtowni danych. Każdy z nich ma swoje mocne i słabe strony, a także typy danych, z którymi lepiej sobie radzi. Nie jest niczym niezwykłym, że kilka różnych modeli hurtowni danych lub systemy hybrydowe, które wykorzystują zalety wielu typów, istnieją w tym samym systemie.
System Flat to model hurtowni danych, który wielu użytkowników uznałby za najłatwiejszy. Ten sposób przechowywania danych obejmuje połączone ze sobą wiersze i kolumny informacji, podobnie jak w arkuszu kalkulacyjnym. Chociaż ta metoda jest łatwa do odczytania dla ludzi, jest trudniejsza dla komputerów i wolniejsza w korelacji.
Hierarchiczny model hurtowni danych przechowuje informacje w ciągłej serii poziomów. Każdy poziom zawiera informacje zależne od generacji powyżej. Jest to bardzo podobne do modelu sieciowego, który zawiera również szereg poziomów zależnych. Różnica polega na ich zależnościach — w systemie hierarchicznym każdy blok danych może mieć tylko jeden wyższy poziom zależności, ale w modelu sieciowym może mieć ich tyle, ile potrzebuje. W obu przypadkach pojedynczy blok informacji może łączyć się z kilkoma blokami poniżej.
Model relacyjnej hurtowni danych jest odmianą systemu Flat. Dane są przechowywane w tabelach, podobnie jak w systemie Flat, a każda podstawowa część danych otrzymuje unikalny identyfikator. Ten identyfikator podróżuje wraz z danymi, zapewniając unikalność. Na przykład, jeśli pracodawca ma dwóch pracowników o tym samym nazwisku, ich identyfikator nadal oddziela ich w systemie. Ten identyfikator jest skorelowany w całym systemie — jeśli wszystko działa poprawnie, za każdym razem, gdy coś związanego z unikalnymi informacjami wchodzi do systemu, koreluje to z wcześniej istniejącymi informacjami opartymi na samym identyfikatorze.
Model wymiarowy oparty jest na modelu hierarchicznym. Pojedynczy fakt jest używany jako punkt wyjścia, a następnie spływają z niego dodatkowe informacje dotyczące tego faktu. Element taki jak numer pracownika byłby początkowym faktem; wtedy daty związane z tym pracownikiem, a także wynagrodzenie lub czas urlopu, będą się z nim łączyć, gdy wejdą do systemu.
Modele relacyjnej i wymiarowej hurtowni danych to dwa najpopularniejsze style. Istnieją inne rodzaje hurtowni danych, ale są one niewielkie w porównaniu z nimi. Ogólnie rzecz biorąc, nowe modele są budowane z systemów płaskich, hierarchicznych lub sieciowych; często są to tylko proste ulepszenia ich podstawowej metody organizowania.