Gândiți-vă la asta ca la curățenie pentru datele dvs. ETL înseamnă extragere, transformare și încărcare. ETL este un software care permite companiilor să-și consolideze datele disparate în timp ce le mută dintr-un loc în altul și nu contează cu adevărat că acele date sunt în forme sau formate diferite. Datele pot proveni din orice sursă. ETL este suficient de puternic pentru a gestiona astfel de disparități de date.
De exemplu, o instituție financiară poate avea informații despre un client în mai multe departamente și fiecare departament ar putea avea informațiile despre acel client listate într-un mod diferit. Departamentul de membri ar putea enumera clientul după nume, în timp ce departamentul de contabilitate ar putea lista clientul după număr. ETL poate grupa toate aceste date și le poate consolida într-o prezentare uniformă, cum ar fi pentru stocarea într-o bază de date sau într-un depozit de date.
Un alt mod prin care companiile folosesc ETL este mutarea permanentă a informațiilor într-o altă aplicație. De exemplu, datele de procesare a textului pot fi traduse în numere și litere, care sunt mai ușor de urmărit într-o foaie de calcul sau un program de bază de date. Acest lucru este deosebit de util în salvarea informațiilor pe măsură ce companiile trec la un nou software.
O funcție importantă a ETL este „curățarea” datelor. Protocoalele de consolidare ETL includ și eliminarea datelor duplicate sau fragmentare, astfel încât ceea ce trece din porțiunea E a procesului în porțiunea L este mai ușor de asimilat și/sau stocat. Astfel de operațiuni de curățare pot include și eliminarea anumitor tipuri de date din proces. Dacă nu doriți să includeți anumite informații, vă puteți personaliza ETL pentru a elimina acest tip de informații din transformarea dvs.
Porțiunea T a ecuației, desigur, este cea mai puternică. ETL poate transforma nu numai date din diferite departamente, ci și date din surse diferite în totalitate. De exemplu, datele dintr-un program de e-mail, cum ar fi Microsoft Outlook, ar putea fi transformate chiar împreună cu datele dintr-o aplicație de producție SAP, rezultatul fiind în cele din urmă datele dintr-un fir comun. Microsoft, desigur, face un pachet ETL, la fel ca și Oracle și IBM.