Co to jest ETL?

Pomyśl o tym jako o sprzątaniu swoich danych. ETL oznacza wyodrębnianie, przekształcanie i ładowanie. ETL to oprogramowanie, które umożliwia firmom konsolidację różnych danych podczas przenoszenia ich z miejsca na miejsce i nie ma znaczenia, że ​​dane te mają różne formy lub formaty. Dane mogą pochodzić z dowolnego źródła. ETL jest wystarczająco potężny, aby poradzić sobie z takimi rozbieżnościami w danych.

Na przykład instytucja finansowa może mieć informacje o kliencie w kilku działach, a każdy dział może mieć informacje o kliencie wymienione w inny sposób. Dział członkostwa może wymieniać klienta według nazwy, natomiast dział księgowości może wymieniać klienta według numeru. ETL może zebrać wszystkie te dane i skonsolidować je w jednolitą prezentację, na przykład do przechowywania w bazie danych lub hurtowni danych.

Innym sposobem, w jaki firmy korzystają z ETL, jest trwałe przenoszenie informacji do innej aplikacji. Na przykład dane edytora tekstu mogą zostać przetłumaczone na cyfry i litery, które łatwiej jest śledzić w arkuszu kalkulacyjnym lub programie bazodanowym. Jest to szczególnie przydatne w przypadku tworzenia kopii zapasowych informacji, gdy firmy całkowicie przechodzą na nowe oprogramowanie.

Jedną z ważnych funkcji ETL jest „oczyszczanie” danych. Protokoły konsolidacyjne ETL obejmują również eliminację duplikatów lub fragmentarycznych danych, dzięki czemu to, co przechodzi z części E procesu do części L, jest łatwiejsze do przyswojenia i/lub przechowywania. Takie operacje czyszczące mogą również obejmować eliminację pewnych rodzajów danych z procesu. Jeśli nie chcesz uwzględniać pewnych informacji, możesz dostosować swój ETL, aby wyeliminować tego rodzaju informacje z transformacji.

Część T równania jest oczywiście najpotężniejsza. ETL może przekształcać nie tylko dane z różnych działów, ale także dane z różnych źródeł. Na przykład dane w programie pocztowym, takim jak Microsoft Outlook, mogą zostać przekształcone wraz z danymi z aplikacji produkcyjnej SAP, w wyniku czego ostatecznie będą dane wspólnego wątku. Microsoft oczywiście tworzy pakiety ETL, podobnie jak Oracle i IBM.