W operacjach komputerowych usterka opisuje nieprzewidzianą awarię lub utratę usługi w aplikacji. Monitorowanie usterek to proces używany do monitorowania wszystkich konfiguracji sprzętu, oprogramowania i sieci pod kątem wszelkich odchyleń od normalnych warunków pracy. Ten proces monitorowania zazwyczaj obejmuje duże i drobne zmiany oczekiwanej przepustowości, wydajności i wykorzystania ustalonego środowiska komputerowego.
Pomyślne wdrożenia oprogramowania komputerowego wymagają znacznej infrastruktury w obszarze sprzętu, oprogramowania i sieci. Ta złożona integracja i współpraca między interoperacyjnymi komponentami prowadzi do wielu możliwości wystąpienia błędów w środowisku aplikacji. W celu skrócenia czasu przestojów proaktywne monitorowanie usterek zapewnia szybkie powiadamianie i łagodzenie błędów środowiskowych komputera.
Poziom proaktywnego monitorowania środowiska komputerowego powinien opierać się na znaczeniu infrastruktury. Zaawansowane procesy monitorowania usterek mogą stać się kosztowne i czasochłonne. Należy zadbać o to, aby zaprojektować właściwy poziom monitorowania w oparciu o jakość usług wymaganą dla pakietu aplikacji.
Prosty proces monitorowania może obejmować przeglądanie dzienników błędów w pliku dziennika aplikacji lub systemie operacyjnym. Ten rodzaj monitorowania można zautomatyzować, aby zapewnić powiadomienie w czasie rzeczywistym w przypadku wystąpienia błędów. Gdy błędy zostaną rozprzestrzenione, administratorzy mogą szybko wdrożyć strategie łagodzące, aby rozwiązać zidentyfikowany problem.
W środowiskach aplikacji korporacyjnych zazwyczaj wdrażane jest zaawansowane monitorowanie błędów, które obejmuje wszystkie poziomy monitorowania. Środowiska te mają kluczowe znaczenie dla firmy, ponieważ przestój systemu wpływa na przychody. Ten typ monitorowania zazwyczaj obejmuje centrum danych przedsiębiorstwa z wstępną introspekcją wszystkich aspektów konfiguracji przedsiębiorstwa.
Dzięki zaawansowanym konfiguracjom monitorowania błędów wszelkie odchylenia od normalnych są szybko identyfikowane i wdrażane są strategie łagodzenia. Przykładem zaawansowanego monitorowania błędów jest zdolność do rozpoznawania nietypowych skoków w ruchu sieciowym. Po zidentyfikowaniu ruch może być proaktywnie kierowany do dodatkowych serwerów i ścieżek sieciowych, aby zapewnić utrzymanie jakości usług.
Aplikacje komputerowe opierają się na sprzęcie i sieciach, które z biegiem czasu nieuchronnie będą miały poważną awarię lub usterkę. Średni czas między awariami to termin komputerowy używany do przewidywania czasu między każdą poważną awarią na podstawie bieżącej konfiguracji. Monitorowanie usterek to technika wykorzystywana do identyfikowania błędów i szybkiego podejmowania środków zaradczych w przypadku wystąpienia nieuniknionej awarii.