Ce este potrivirea schemelor?

Potrivirea schemelor este o tehnică utilizată pentru a îmbina două sau mai multe baze de date complexe sau seturi de informații unul în celălalt. Pe măsură ce utilizarea bazelor de date și a stocării electronice a informațiilor devine din ce în ce mai mare și mai complexă prin Internet, trebuie definite metode de îmbinare a seturi de date de la o bază de date la alta, iar potrivirea schemelor este una dintre aceste tehnici. Conceptul este simplu, dar realitatea îmbinării datelor este destul de complexă.

Termenul „potrivire schema” este folosit ca sinonim cu „mapping schema”, deoarece utilizatorii cartografiază de fapt date, nu le potrivesc. Două sau mai multe baze de date sunt mapate împreună și aspecte similare ale fiecărei baze de date sunt mapate una în cealaltă. Cel mai obișnuit mod de a îmbina datele este utilizarea referințelor exacte. Un exemplu de acest stil de îmbinare este combinarea coloanei de nume a unei baze de date cu coloana de nume a altei baze de date.

Fuzionarea nu este de obicei atât de simplă, pentru oameni sau computere. Având în vedere că atât de multe date trebuie filtrate, combinate și utilizate, este esențial să aveți o singură bază de date, mai degrabă decât mai multe. Maparea schemelor se concentrează pe a face acest proces obositor automatizat și mai eficient. Un exemplu în care este necesară potrivirea schemei ar putea fi atunci când o bază de date are un câmp „majorul studentului” și o altă bază de date are un câmp „domeniul de studiu al studentului”. Este aceeași informație, dar titlurile ușor diferite complică eforturile de a le îmbina.

Potrivirea schemelor împarte acest proces complex de îmbinare a bazelor de date în patru pași: preintegrare, comparare, conformare și îmbinare. Înainte ca mai multe baze de date să poată fi îmbinate, acestea trebuie analizate pentru asemănări și diferențe. În domeniul potrivirii schemelor, aceasta este cunoscută ca pre-integrare. Calculatorul începe să determine cea mai eficientă metodă de integrare.

Apoi, computerul evaluează schemele comparându-le între ele la un nivel mai detaliat. În pasul de comparare, computerul se uită la fiecare intrare în baza de date și determină unde pot exista conflicte. Un exemplu în acest sens este atunci când un câmp „interesul studentului” listează „medic” și o altă bază de date îl listează ca „medic”. O persoană ar recunoaște probabil informațiile ca fiind aceleași, dar, pentru instrumentele de bază de date, acestea sunt două entități separate.

Odată ce computerul a determinat toate conflictele potențiale, poate merge mai departe încercând să rezolve problemele. Acest lucru poate fi la fel de simplu ca schimbarea tuturor cazurilor de „medic” în „medic”. În realitate, procesul este substanțial mai complex.
Odată ce toate conflictele au fost rezolvate, computerul poate continua cu îmbinarea datelor în procesul de potrivire a schemei. În această etapă, două sau mai multe baze de date sunt îmbinate într-o bază de date mare. Dacă totul merge bine, nu vor apărea conflicte sau erori în timpul integrării și al accesului viitor la baza de date.