Co to jest normalizacja bazy danych?

Normalizacja bazy danych jest stosowana w systemie zarządzania bazami danych (DBMS), w szczególności w relacyjnych bazach danych, w celu zmniejszenia nadmiarowych informacji, a tym samym zminimalizowania anomalii danych. Anomalie mogą wystąpić w przypadku informacji, które są słabo pogrupowane lub nadmiarowe i mogą powodować szereg skutków, takich jak nieprawidłowe wstawienie danych lub usunięcie całej grupy danych. Dzięki normalizacji bazy danych można uniknąć tych anomalii, a pamięć jest zwykle zwalniana, aby baza danych mogła działać wydajniej. Funkcje normalizacyjne powinny być używane okresowo, mniej więcej raz w tygodniu, aby baza danych była świeża i wolna od nieoczekiwanych problemów.

Nikt celowo nie tworzy relacyjnej bazy danych zawierającej nadmiarowe dane, ale zazwyczaj dzieje się tak pomimo wszelkich starań projektanta bazy danych. Na przykład w przypadku bazy danych pracowników pracownik może być wymieniony w kilku tabelach. Gdy nadmiarowość występuje na dużą skalę, powstają anomalie. Administratorzy baz danych zwykle nie mogą przechwycić wszystkich nadmiarowych danych, więc normalizacja bazy danych jest najlepszym sposobem rozwiązania tego problemu.

Pierwszym zadaniem normalizacji bazy danych jest wymazanie lub przenoszenie powtarzających się informacji. Jeśli informacje są niepotrzebne, zostaną usunięte z bazy danych. W przypadku danych potrzebnych w innych tabelach normalizacja ma na celu stworzenie lepszych tabel relacyjnych. Funkcje normalizacyjne rozbijają duże tabele, poprawiają i poprawiają relacje między danymi oraz izolują informacje, aby ułatwić modyfikację danych w bazie danych. Odejmując powtarzające się dane, pamięć jest zwykle zwalniana, co pozwala na płynniejsze i szybsze działanie bazy danych.

Anomalie wynikają z odmowy lub zapomnienia o normalizacji bazy danych i mogą sprawić, że informacje staną się bezużyteczne. Anomalia aktualizacji ma miejsce, gdy ktoś aktualizuje dane, ale zamiast zmieniać dane docelowe, baza danych utworzy nowy rekord, który jest wysoce nadmiarowy. W przypadku anomalii wstawiania rekord jest dodawany do bazy danych, ale niczego nie można dodać pod nowym rekordem. Anomalie usuwania spowodują losowe usunięcie rekordu. To tylko kilka typowych anomalii, które występują, gdy baza danych nie jest znormalizowana.

Nie ma sztywnego standardu mówiącego administratorowi, kiedy powinien używać funkcji normalizacji, aby zapewnić wydajność bazy danych. Planowanie normalizacji bazy danych raz w tygodniu jest zwykle najlepsze, ponieważ zapobiega to występowaniu anomalii we wszystkich nowych informacjach dodawanych w ciągu tygodnia. Mniejsze bazy danych prawdopodobnie można normalizować raz w miesiącu, a bardzo duże bazy danych należy wykonywać dwa razy w tygodniu, ponieważ większe ilości danych wiążą się z większą szansą na anomalie. Nie ma jednak standardu, więc administrator bazy danych zazwyczaj wybiera harmonogram, który według niego jest najlepszy dla bazy danych.