Ce este integrarea datelor?

Integrarea datelor este îmbinarea mai multor surse de date într-o singură sursă de date. Această practică necesită adesea foarte mult timp și implică, deoarece diferitele surse de date sunt probabil incompatibile unele cu altele. Lucruri la fel de simple precum diferite nume de coloane dintr-o foaie de calcul sunt suficiente pentru a necesita reformatarea datei. Acest proces este cel mai frecvent în situațiile în care două grupuri au început fără nicio conexiune, dar sunt puse împreună după ce au lucrat independent. Integrarea datelor a devenit un subiect mai important datorită prevalenței surselor de date gratuite și a bazelor de date online.

Partea de date a integrării datelor poate fi aproape orice, atâta timp cât este stocată într-un sistem informatic. Conținutul real al datelor este rareori la fel de important ca și modul în care sunt stocate datele. De cele mai multe ori, datele sunt păstrate în baze de date, sisteme organizate de informare. Aceste sisteme conțin intrări și câmpuri unice care permit utilizatorilor să găsească rapid informații.

Cel mai mare obstacol în calea oricărui proces de integrare a datelor sunt datele în sine. În multe cazuri, atunci când datele au fost configurate pentru prima dată, nu a existat nicio intenție de a fuziona setul de date cu altul. Aceasta înseamnă că, deși două seturi de date se pot referi la același lucru, ele sunt total incompatibile.

Aproape orice va face bazele de date incompatibile. Ceva la fel de simplu ca o diferență de prezentare, cum ar fi ordinea câmpurilor sau lățimea coloanei, poate fi suficient pentru a preveni o fuziune ușoară. Când datele sunt semnificativ diferite, cum ar fi o bază de date care conține mai multe sau mai puține informații, fuzionarea este mult mai dificilă.

Cele două situații care necesită integrarea datelor mai mult decât oricare alta sunt în domeniul afacerilor și al cercetării. În lumea afacerilor, fuzionarea departamentelor sau companiilor necesită combinarea informațiilor separate anterior într-o singură structură. Această formă de integrare este în general foarte dificilă, cu excepția cazului în care grupurile originale au folosit software similar și au avut obiective de informare similare.

Atunci când integrarea datelor este efectuată în scopuri de cercetare, în general decurge mult mai ușor. Când un cercetător dă acces la informațiile sale altuia, cele două părți caută, în general, același proces. Aceasta înseamnă că vor folosi metode similare pentru a-și cataloga și stoca datele.
În trecut, integrarea datelor a fost un domeniu relativ minor al studiilor de date, dar acest lucru s-a schimbat de la începutul secolului al XXI-lea. Cu bazele de date online gratuite care devin mai populare și mai precise, companiile se străduiesc să-și obțină informațiile într-un format care poate fi partajat. Acest lucru le permite atât să-și elibereze informațiile într-o formă publică, cât și să integreze versiuni private ale interfețelor publice binecunoscute în sistemele lor.