Co to jest zarządzanie kondycją produktu WebSphere?

Opublikowany: 2015-02-14

Dowiedz się więcej o zarządzaniu kondycją na serwerze IBM WebSphere Application Server i tworzeniu strategii dotyczących kondycji.

Co to jest zarządzanie zdrowiem?

Health Management jest częścią środowiska WebSphere Virtual Enterprise zintegrowanego z produktem WebSphere Application Server 8.5.

WebSphere 8.5 jest zintegrowany ze strategiami operacyjnymi , które wykorzystują zasady kondycji.

Health Management to oparte na strategiach podejście do monitorowania użycia serwera aplikacji korporacyjnych WebSphere i umożliwiające reagowanie na obszary problemowe przed wystąpieniem awarii.

Zarządzanie zdrowiem składa się z dwóch elementów:

kontroler zdrowia
polityka zdrowotna

Co to jest tryb reakcji?

Zasady zdrowotne obejmują stan zdrowia, który chcesz monitorować w swoim środowisku. Reaguje, gdy zdefiniowane wymagania nie są spełnione.

Istnieją dwa tryby reakcji.

Tryb automatyczny : system podejmie działania po wykryciu naruszenia zasad kondycji.

Na przykład, jeśli skonfigurujesz monitorowanie użycia pamięci i chcesz zrestartować maszynę JVM, gdy użycie wiadomości wynosi 85%, system zrestartuje docelową maszynę JVM, gdy rozmiar sterty JVM osiągnie 85%.

Tryb nadzorowany : system utworzy zadanie wykonawcze po wykryciu naruszenia zasad kondycji. Wymaga to ręcznej interwencji administratora produktu WebSphere w celu zatwierdzenia lub odrzucenia działania zadania w czasie wykonywania.

Co to są warunki zdrowotne?

Stan kondycji to obiekt lub metryki, które chcesz monitorować w swoim środowisku.

W produkcie WebSphere 8.5 dostępnych jest osiem predefiniowanych warunków kondycji . Masz możliwość utworzenia niestandardowego stanu zdrowia.

Warunek oparty na wieku — ten warunek będzie monitorować zdefiniowaną maszynę JVM i podejmować działania, gdy osiągnie skonfigurowany próg wieku.

Były:

Możesz skonfigurować ten warunek, aby ponownie uruchomić maszynę wirtualną JVM, jeśli działa przez 15 dni. Dopuszczalna wartość dla tej sytuacji jest w dniach lub godzinach, jak pokazano poniżej.

stan oparty na wieku

Warunek nadmiernego limitu czasu żądania – warunek ten zadziała, gdy procent limitu czasu żądania przekroczy zdefiniowaną wartość. Dopuszczalna wartość jest wyrażona w procentach, jak pokazano poniżej.

nadmierny limit czasu na żądanie

Warunek nadmiernego czasu odpowiedzi – monitoruje czas potrzebny na zakończenie żądania i podjęcie działań, jeśli czas przekroczy zdefiniowany próg.

Były:

Możesz skonfigurować ten warunek, aby wykonać zrzut wątku, gdy czas odpowiedzi na żądanie wynosi jedną minutę. Dopuszczalna wartość jest w milisekundach, sekundach i minutach, jak pokazano poniżej.

nadmierny czas odpowiedzi

Stan pamięci: nadmierne użycie pamięci – monitoruje użycie pamięci JVM i podejmuje działania, jeśli przekroczy wartość progową.

Były:

Możesz skonfigurować ten warunek, aby wykonać zrzut sterty maszyny JVM i ponownie uruchomić maszynę JVM, gdy użycie pamięci przekroczy próg. Dopuszczalna wartość rozmiaru sterty maszyny JVM jest wyrażona w procentach, a okres wykroczenia w sekundach i minutach, jak pokazano poniżej.

użycie-warunku-pamięci

Stan pamięci: przeciek pamięci — spowoduje to wyszukanie wycieków pamięci w JVM i podjęcie działań.

Wyciek-warunku-pamięci

To ma trzy poziomy wykrywania.

Szybko (fałszywe alarmy)
Standard (niektóre fałszywe alarmy)
Powolny (mniej fałszywych alarmów)

Warunek drenażu burzowego — monitoruj znaczny spadek średniego czasu odpowiedzi i podejmij działania, takie jak generowanie zrzutu wątków i ponowne uruchamianie JVM.

polityka-zdrowotna-burza

To ma dwa poziomy wykrywania.

Standard (niektóre fałszywe alarmy)
Powolny (mniej fałszywych alarmów)

Warunek obciążenia — ten warunek zostanie wykryty, gdy JVM obsłuży skonfigurowaną liczbę żądań.

Były:

Można skonfigurować ponowne uruchomienie maszyny JVM po obsłużeniu 20000000 żądań.

obciążenie-stan-zdrowia

Warunek procentowy wyrzucania elementów bezużytecznych — monitoruje procent czasu spędzonego na wyrzucaniu elementów bezużytecznych przez określony czas i podejmuje działanie, gdy przekroczy próg. Dopuszczalna wartość to procent i okres próbkowania, jak pokazano poniżej.

stan-zdrowia-gc

Co to jest akcja zdrowotna?

Akcja kondycji to akcja zasad kondycji, która ma zostać uruchomiona po przekroczeniu skonfigurowanego progu.

W produkcie WebSphere 8.5 dostępnych jest siedem predefiniowanych działań dotyczących kondycji .

zdrowie-działanie

Uruchom ponownie serwer — aby zrestartować JVM
Take zrzuty wątków – aby wziąć zrzuty wątków JVM
Weź zrzuty sterty JVM – aby wziąć zrzuty sterty JVM
Generowanie pułapki SNMP — generowanie pułapki SNMP w celu rozwiązywania problemów
Przełącz serwer w tryb konserwacji - zatrzymaj nowe żądania klientów i obsługuj tylko aktywną sesję
Przełącz serwer w tryb konserwacji i przerwij koligację – zatrzymaj nową i istniejącą sesję akcji
Miejsce poza trybem konserwacji – gotowe do przyjęcia nowych wniosków

Masz możliwość utworzenia niestandardowej akcji zdrowia.

Jak tworzyć polityki zdrowotne?

Polityki zdrowotne można stworzyć w czterech prostych krokach.

Zdefiniuj ogólne właściwości polityki zdrowotnej – w tym miejscu podaj nazwę polityki i wybierz stan zdrowia
Zdefiniuj właściwości stanu zdrowia polityki zdrowotnej - tutaj, aby podać próg wybranego stanu zdrowia i skonfigurować wymagane działania, które należy podjąć w przypadku naruszenia stanu zdrowia
Określ członków, którzy mają być monitorowani — wybierz JVM, Klastry, Klastry dynamiczne, routery na żądanie lub Komórkę jako cel zasad dotyczących zdrowia
Potwierdź utworzenie zasad zdrowotnych — przejrzyj konfigurację zasad zdrowotnych i potwierdź utworzenie

Stwórzmy jedną politykę zdrowotną w następujący sposób.

Zaloguj się do konsoli WebSphere 8.5 ND DMGR
Kliknij Zasady operacyjne >> Zasady zdrowotne
Kliknij Nowy
Podaj nazwę – Test_Policy
Wybierz stan kondycji jako stan obciążenia (możemy szybko przetestować ten stan)
Kliknij Następny
Wprowadź łączną liczbę żądań jako 1000 do celów testowych
Wybierz tryb reakcji jako Automatyczny
Dodaj działanie Uruchom ponownie serwer i weź zrzuty wątków

obciążenie-polityką-zdrowia

Kliknij Następny
Wybierz Filtruj według jako Serwery/Węzły
Dodaj serwer1 jako członka docelowego
Kliknij Dalej
Sprawdź konfigurację i kliknij Zakończ

polityka-zdrowotna-podsumowanie

Teraz przetestujmy, uzyskując dostęp do aplikacji działającej na docelowej maszynie wirtualnej JVM (serwer1).

Gdy JVM obsłuży 1000 żądań, powinna wykonać zrzut wątku i zrestartować. Możesz użyć JMeter, aby umieścić obciążenie, dzięki czemu testowanie może być wykonane szybko.

Co to jest kontroler zdrowia?

Kontroler kondycji kontroluje zasady kondycji i monitoruje system. Monitorowanie kondycji musi być włączone w kontrolerze kondycji, aby monitorować zasady.

Sam kontroler kondycji ma konfigurowalne właściwości, takie jak częstotliwość jego uruchamiania, a czasami ponowne uruchomienie serwera.

Pozwala to na ograniczenie restartu serwera w godzinach szczytu biznesowego.

Co to jest cel polityki zdrowotnej?

Celem polityki zdrowia lub działania może być JVM, klastry, klastry dynamiczne, routery na żądanie lub komórki.

Mam nadzieję, że pomoże to lepiej zrozumieć. Jeśli jesteś zainteresowany nauką DevOps, sprawdź ten podstawowy kurs.