Co to jest testowanie hurtowni danych?

Testowanie w hurtowni danych to proces używany do sprawdzania i kwalifikowania integralności danych przechowywanych w jakimś typie magazynu. Ideą testowania jest upewnienie się, że dane nie uległy żadnemu uszkodzeniu i są kompletne oraz możliwe do odzyskania w razie potrzeby. Regularne testowanie przechowywanych danych umożliwia zidentyfikowanie wszelkich problemów, które mogą się rozwijać i naprawienie tych problemów, zanim przechowywane dane ulegną całkowitemu uszkodzeniu i można je tylko częściowo odtworzyć przy użyciu pewnego rodzaju procesu odzyskiwania danych.

Pod wieloma względami testowanie hurtowni danych jest bardzo podobne do wszelkiego rodzaju testów przeprowadzanych w celu zapewnienia integralności informacji przechowywanych na dysku twardym komputera lub zdalnym urządzeniu pamięci masowej. Dane zawarte w hurtowni są systematycznie sprawdzane za pomocą programu, który odczytuje każdy plik lub inne źródło danych, aby upewnić się, że pozostają one w pełni nienaruszone i dostępne. Niektóre typy oprogramowania do testowania hurtowni danych mają możliwość korygowania ograniczonego zakresu błędów w ramach całego procesu testowania. Inne po prostu kompilują listę wyjątków, umożliwiając użytkownikowi ocenę każdego wyjątku indywidualnie przed podjęciem jakichkolwiek działań.

Testowanie hurtowni danych zwykle wykorzystuje model wyzwalany przez system. Oznacza to po prostu, że oprogramowanie wykorzystuje podstawową formułę znaną jako ETL lub ekstrakcja-transformacja-ładowanie. Chodzi o to, aby porównać aktualny stan danych ze stanem informacji w momencie ich pierwszego zmagazynowania. W przypadku wykrycia jakichkolwiek błędów dane są oznaczane do dalszego przeglądu. W większości przypadków błędy lub wyjątki są niewielkie i można je naprawić stosunkowo niewielkim nakładem pracy, korzystając z protokołów wbudowanych w oprogramowanie testowe lub dokonując przeglądu przez analityka, który może albo zatwierdzić naprawę, albo odrzucić wyjątek jako rzeczywiście jakiś rodzaj uszkodzenia .

Podstawowy proces testowania hurtowni danych przypomina testowanie każdego rodzaju elektronicznej transakcji informacyjnej. Informacje są sprawdzane w blokach lub komórkach, które są następnie usuwane lub odnotowywane pod kątem wszelkich wyjątków zidentyfikowanych przez oprogramowanie przed przejściem do następnego bloku. Po zakończeniu procesu kompilowane jest podsumowanie testów, w tym informacje o typach znalezionych wyjątków oraz o tym, czy te wyjątki zostały poprawione podczas testowania, czy też czekają na ręczne sprawdzenie. Podobnie jak w przypadku każdego rodzaju testowania systemu, dobrym pomysłem jest regularne przeprowadzanie testów hurtowni danych, aby upewnić się, że informacje pozostają kompletne i wolne od wszelkiego rodzaju uszkodzeń.