Co to jest relacyjna baza danych?

Relacyjna baza danych składa się ze zbioru tabel, które przechowują określone zestawy danych. Wynalezienie tego systemu baz danych znormalizowało sposób przechowywania i przetwarzania danych. Pojęcie relacyjnej bazy danych wywodzi się z zasad algebry relacyjnej, realizowanej w całości przez ojca relacyjnych baz danych, EF Codda. Większość używanych obecnie systemów baz danych opiera się na systemie relacyjnym; jednak relacyjne bazy danych są wbudowane w oprogramowanie kupowane przez ludzi i firmy, więc baza danych jest generalnie niewidoczna dla ogółu społeczeństwa.

Historia relacyjnej bazy danych rozpoczęła się od artykułu Codda z 1970 roku, A Relational Model of Data for Large Shared Data Banks. Teoria ta zakłada, że ​​dane powinny być niezależne od jakiegokolwiek sprzętu lub systemu pamięci i zapewniać automatyczną nawigację między elementami danych. W praktyce oznaczało to, że dane powinny być przechowywane w tabelach i że istniałyby relacje między różnymi zestawami danych lub tabelami.

Zawartość bazy danych

Relacja, która jest tabelą dwuwymiarową, jest podstawową jednostką pamięci w relacyjnej bazie danych. Relacyjna baza danych może zawierać jedną lub więcej takich tabel, przy czym każda tabela składa się z unikalnego zestawu wierszy i kolumn. Pojedynczy rekord jest przechowywany w tabeli jako wiersz, znany również jako krotka, podczas gdy atrybuty danych są zdefiniowane w kolumnach lub polach w tabeli. Charakterystyka danych lub kolumna wiąże jeden rekord z drugim. Każda kolumna ma unikalną nazwę, a zawartość w niej musi być tego samego typu.

Tabele porównawcze

Tabele mogą być ze sobą powiązane na różne sposoby. Zależności funkcjonalne powstają, gdy atrybut jednej tabeli odnosi się do atrybutów innych tabel. Najprostsza relacja to relacja jeden-do-jednego, w której jeden rekord w tabeli jest powiązany z innym rekordem w oddzielnej tabeli. Relacja jeden-do-wielu to taka, w której jeden rekord w tabeli jest powiązany z wieloma rekordami w innej tabeli. Relacja wiele do jednego definiuje sytuację odwrotną; więcej niż jeden rekord w jednej tabeli odnosi się tylko do jednego rekordu w innej tabeli. Wreszcie w relacji wiele-do-wielu więcej niż jeden rekord w tabeli odnosi się do więcej niż jednego rekordu w innej tabeli.
Różnicowanie danych
Odnosząc się do relacyjnej bazy danych, klucz jest jednostką w tabeli, która odróżnia jeden wiersz danych od drugiego. Klucz może być pojedynczą kolumną lub może składać się z grupy kolumn, które jednoznacznie identyfikują rekord. Tabele mogą zawierać klucze podstawowe, a także klucze obce. Klucze podstawowe służą do rozróżniania między rekordami; mogą być indywidualnym atrybutem lub kombinacją atrybutów. Klucze obce wiążą ze sobą tabele w bazie danych i ogólnie definiują relacje nadrzędny-podrzędny między tabelami. Ponadto klucz obcy w jednej tabeli może być kluczem podstawowym w innej.
Organizowanie danych
Dane przechowywane w tabelach są zorganizowane w logiczny sposób w oparciu o określony cel, aby pomóc zminimalizować powielanie, zmniejszyć anomalie danych i wzmocnić integralność danych. Proces, w którym dane są logicznie zorganizowane, nazywa się normalizacją; nie tylko upraszcza sposób definiowania danych, ale także reguluje ich strukturę. W procesie normalizacji jest pięć form, z których każda spełnia bardziej wymagający warunek. Pierwsza postać normalna, 1NF, spełnia minimalne wymagania dotyczące normalności i ma najmniejszą integralność danych, podczas gdy piąta postać normalna, czyli 5NF, tworzy strukturę danych z najmniejszą liczbą anomalii i najlepszą integralnością.
Przechowywane dane są manipulowane przy użyciu języka programowania o nazwie Structured Query Language lub SQL. Istnieje wiele odmian języka SQL, ale większość z nich opiera się na operatorach relacyjnych teorii mnogości, takich jak i, lub, nie, oraz w, z których wszystkie służą do wykonywania operacji na danych. Operacje, których można używać w relacyjnych bazach danych, obejmują uprawnienia do wstawiania, wybierania, aktualizowania i usuwania.
Opcje produktu
Na początku 2010 roku system zarządzania relacyjnymi bazami danych (RDBMS) jest najczęściej używanym formatem baz danych; jest często używany przez firmy i korporacje do aktualizacji i administrowania relacyjnymi bazami danych. Historycznie istniały trzy wiodące firmy RDBMS: Oracle®, który stworzył pierwszą komercyjną relacyjną bazę danych w 1979 roku; IBM®, który poszedł w jego ślady w 1982 r., wprowadzając system danych SQL, później przemianowany na DB2®; oraz Microsoft®, który dołączył do programu SQL Server® 4.2 w 1992 roku. Inne firmy również oferują produkty RDBMS, z których większość można kupić na stronie internetowej firmy lub w sklepach detalicznych sprzedających oprogramowanie komputerowe, a ceny różnią się w zależności od firmy.