Dopasowywanie schematu to technika używana do łączenia ze sobą dwóch lub więcej złożonych baz danych lub zestawów informacji. Ponieważ korzystanie z baz danych i elektronicznego przechowywania informacji staje się coraz większe i bardziej złożone w Internecie, należy zdefiniować metody łączenia zestawów danych z jednej bazy danych do drugiej, a dopasowywanie schematów jest jedną z takich technik. Koncepcja jest prosta, ale rzeczywistość łączenia danych jest dość złożona.
Termin „dopasowanie schematu” jest używany jako synonim „odwzorowania schematu”, ponieważ użytkownicy w rzeczywistości mapują dane, a nie je dopasowują. Co najmniej dwie bazy danych są mapowane razem, a podobne aspekty każdej bazy danych są mapowane na siebie. Najpopularniejszym sposobem scalania danych jest użycie dokładnych odwołań. Przykładem takiego stylu łączenia jest łączenie kolumny nazwy jednej bazy danych z kolumną nazwy innej bazy danych.
Scalanie zwykle nie jest takie proste, dla ludzi lub komputerów. Przy tak dużej ilości danych, które trzeba przefiltrować, połączyć i wykorzystać, posiadanie jednej bazy danych zamiast wielu baz danych jest niezbędne. Mapowanie schematu skupia się na zautomatyzowaniu i usprawnieniu tego żmudnego procesu. Przykładem konieczności dopasowania schematu może być sytuacja, w której jedna baza danych zawiera pole „kierunek studenta”, a inna baza danych zawiera pole „kierunek studiów studenta”. To te same informacje, ale nieco inne tytuły komplikują starania o ich połączenie.
Dopasowywanie schematu dzieli ten złożony proces łączenia baz danych na cztery etapy: wstępna integracja, porównanie, dostosowanie i łączenie. Przed połączeniem wielu baz danych należy je przeanalizować pod kątem podobieństw i różnic. W dziedzinie dopasowywania schematów jest to znane jako integracja wstępna. Komputer zaczyna określać najbardziej wydajną metodę integracji.
Następnie komputer ocenia schematy, porównując je ze sobą na bardziej szczegółowym poziomie. W kroku porównania komputer sprawdza każdy wpis w bazie danych i określa, gdzie mogą wystąpić konflikty. Przykładem tego jest sytuacja, w której pole „zainteresowania ucznia” zawiera nazwę „lekarz”, a inna baza danych wymienia go jako „lekarz”. Osoba prawdopodobnie rozpoznałaby te informacje jako takie same, ale w przypadku narzędzi bazodanowych są to dwie oddzielne jednostki.
Gdy komputer określi wszystkie potencjalne konflikty, może przejść do przodu, próbując rozwiązać problemy. Może to być tak proste, jak zmiana wszystkich wystąpień „lekarza” na „lekarz”. W rzeczywistości proces jest znacznie bardziej złożony.
Po rozwiązaniu wszystkich konfliktów komputer może przystąpić do scalania danych w procesie dopasowywania schematów. Na tym etapie co najmniej dwie bazy danych są łączone w jedną dużą bazę danych. Jeśli wszystko pójdzie dobrze, nie wystąpią żadne konflikty ani błędy podczas integracji i przyszłego dostępu do bazy danych.