Przechwytywanie zmian danych to proces lokalizowania, rejestrowania i zapisywania rekordów wersji w systemach danych. W większości przypadków systemy przechwytywania zmian danych działają poprzez nadawanie danym określonych znaczników, które odwołują się do określonych wpisów danych. Gdy dane ulegają zmianie, zmieniają się również te znaczniki. To ostrzega system przechwytywania danych o zmianach i zapisuje starszą wersję danych, dając użytkownikom i systemom dostęp zarówno do starych, jak i nowych danych. Procesy te są powszechne w dużych systemach przechowywania danych, takich jak hurtownie danych i internetowe systemy danych.
Wersjonowanie danych jest uważane za bardzo ważny aspekt przechowywania danych. Kiedy jeden fragment danych zostanie nadpisany przez inny, oryginalny fragment danych nie może po prostu zniknąć. Spowodowałoby to spustoszenie, gdyby ta informacja była ważna dla trwającego procesu lub dokumentacji korporacyjnej.
Tworzenie wersji różnych fragmentów danych jest centrum przechwytywania danych o zmianach. Jeśli jedna informacja zmieni się pięć razy, system musi zapamiętać każdą z pięciu wartości i kiedy się zmieniły. Jest to ważne zarówno dla długoterminowego prowadzenia dokumentacji, jak i sprawdzania błędów. Na przykład, jeśli pracownik przypisał wartość sprzedaży w niewłaściwej części bazy danych, może to zakłócić ogromną ilość informacji. Wersjonowanie pozwala firmie przywrócić ten numer w razie potrzeby.
Nie ma jednej ustalonej metody przechwytywania danych zmian. Różne systemy danych korzystają z własnych wersji, często opracowanych wewnętrznie, aby pasowały do ich własnego stylu przechowywania danych. Mimo to istnieje kilka powszechnie stosowanych metod. Nie jest niczym niezwykłym, że pojedynczy system ma kilka różnych metod przechwytywania danych zmian działających w tym samym systemie. Często każda metoda specjalizuje się w określonym typie przechwytywania lub działa jako nadmiarowy system odporny na awarie.
Najpopularniejszymi metodami tworzenia różnych wersji danych są specjalne znaczniki w danych. Te znaczniki znajdują się w specjalnym wierszu lub kolumnie danych, które śledzą, kiedy zachodzą zmiany. Skrypty przechwytywania danych zmian obserwują te obszary pod kątem zmian i śledzą wprowadzone modyfikacje. Te specjalne komórki mogą zawierać numery wersji, sygnatury czasowe lub zastrzeżone ciągi danych.
Dwa najczęstsze miejsca, w których można znaleźć pełnowymiarowe systemy przechwytywania danych o zmianach, to hurtownie danych i ogólnodostępne bazy danych. Jednym z głównych punktów sprzedaży hurtowni danych jest stałe i kompleksowe tworzenie kopii zapasowych danych. Dopóki użytkownik subskrybuje ich usługi, systemy te nigdy się niczego nie usuwają. Bazy danych o otwartym dostępie, takie jak Wikipedia, wykorzystują wersjonowanie, aby zapobiegać manipulacjom i przechowywać informacje o tym, którzy użytkownicy dokonali jakich zmian. Chociaż wersjonowanie Wikipedii może nie być tak obszerne, jak te używane w hurtowniach danych, często jest badane przez większą liczbę użytkowników.