Co to jest tolerancja na błędy?

Najważniejsze aplikacje komputerowe wymagają konstrukcji zawierającej kilka nadmiarowych komponentów. Ta odporna na awarie konstrukcja zazwyczaj obejmuje sprzęt, oprogramowanie, zasilanie awaryjne i zabezpieczenia sieci przed awariami. Odporność na awarie to konstrukcja, która zapewnia działanie aplikacji komputerowej w przypadku katastrofalnej awarii. Większość banków, rządów i firm użyteczności publicznej używa tego typu konstrukcji do swoich krytycznych aplikacji.

Odporność na awarie zasilania to projekt inżynierski, który zapewnia wiele wejść zasilania do sprzętu komputerowego. Niektóre przykłady nadmiarowości zasilania obejmują wiele obwodów zasilania, dostawców zasilania lub systemy podtrzymania bateryjnego. Ten system automatycznie włączy zasilanie awaryjne w przypadku utraty zasilania elektrycznego.

Plany zasilania awaryjnego zaprojektowane w celu zachowania systemów komputerowych zazwyczaj obejmują generatory zasilane paliwem i duże jednostki akumulatorowe. Kiedy centrum danych traci energię elektryczną, system generatora automatycznie staje się aktywny. Budynki te mogą zazwyczaj utrzymywać zasilanie przez kilka tygodni bez wpływu na ogólną wydajność.

Odporność na uszkodzenia sprzętu to projekt, w którym procesy biznesowe są rozłożone na wiele komponentów komputera. Dzięki temu aplikacja może pozostać funkcjonalna, gdy element sprzętu ulegnie awarii z powodu problemów mechanicznych. Klastrowa baza danych jest przykładem zastosowania sprzętu odpornego na awarie. W tym projekcie fizyczna baza danych jest rozproszona i replikowana na wielu urządzeniach sprzętowych. Jeśli jakikolwiek sprzęt w klastrze ulegnie awarii, baza danych pozostanie aktywna, ponieważ jest rozproszona na wiele jednostek sprzętowych.

Odporność na awarie sieci to kolejny przykład nadmiarowości w systemie komputerowym. Większość operacji w centrum danych obejmuje konfiguracje odporne na awarie sieci. Wymaga to korzystania z wielu dostawców usług telekomunikacyjnych i linii telefonicznych w budynku. W przypadku całkowitej awarii jednego dostawcy, pozostali dostawcy sieci automatycznie go zastąpią. Ten typ konfiguracji zazwyczaj wymaga dwóch aktywnych linii telekomunikacyjnych w jednym fizycznym budynku.

Wiele dużych organizacji i agencji rządowych wymaga odporności na awarie w celu obsługi infrastruktury fizycznej. Gwarantuje to, że zdarzenia katastroficzne, w tym uszkodzenie zasilania i zniszczenie sieci, nie wpłyną na działalność biznesową tych organizacji. Chociaż odporność na awarie nie gwarantuje, że aplikacje nie ulegną awarii, zmniejsza prawdopodobieństwo całkowitej awarii systemu z powodu problemów z komputerem.
Do najważniejszych instytucji rządowych zalicza się odporność na awarie dla całych jednostek biznesowych. Zwykle obejmuje to relokację personelu, sprzętu i zasobów, które mogą wytrzymać klęski żywiołowe przez dłuższy czas. Ten rodzaj rozwiązania odpornego na awarie jest zwykle zlokalizowany głęboko pod ziemią, gdzie klęski żywiołowe mają niewielki wpływ na fizyczne operacje.