Nápověda k definici služby MON

Toto je druhá a poslední fáze konfigurace MON.

Pro služby Povinné jsou zobrazeny výchozí hodnoty . Další nápovědu k definicím služeb naleznete v níže uvedeném tématu nápovědy.

U "mail.alert" se ujistěte, že je nakonfigurován sendmail a na hostmachine je spuštěn deamon "sendmail" .

Definice služeb

servisní název služby
Definice služby začíná tím, že služba klíčových slov následuje slovo, které je značkou této služby.

Součásti služby jsou interval, monitor a jedna nebo více definic časového období, jak je definováno níže.

Pokud je název služby „default“ definován ve skupině sledovaných volaných „dafault“ (viz výše), použije se výchozí / výchozí definice pro zpracování neznámých mon trapů.

intervalové časování
Interval klíčových slov následovaný časovou hodnotou určuje frekvenci spouštění monitorovacího skriptu. Časové hodnoty jsou definovány jako „30s“, „5m“, „1h“ nebo „1d“, což znamená 30 sekund, 5 minut, 1 hodinu nebo 1 den. Číselná část může být zlomek, například „1,5 hodiny“ nebo hodinu a půl. Tento formát časové specifikace bude označován jako časově závislý .

Traptimeout timeval
Toto klíčové slovo má stejný specifikace argumentu úvazek jako interval, a dělá službu očekávají pasti z externího zdroje alespoň tak často, jinak selhání bude registrován. Používá se pro službu ve stylu srdce.

trapduration timeval
Je-li pasti přijata, zůstane stav služby, do které byla pasti doručena, obvykle konstantní. Je-li zadána trapdurace , zůstane stav služby ve stavu selhání po dobu stanovenou timevalem a poté bude resetována na „úspěch“.

randskew timeval
Spíše než naplánovat, aby se monitorovací skript spouštěl na začátku každého intervalu, náhodně upravte interval určený parametrem intervalu pomocí plus nebo mínus randskew. Hodnota zkosení je zadána jako parametr intervalu : "30s", "5m" atd. Například, pokud je interval 1m a randskew je "5s", pak mon naplánuje monitorovací skript někdy mezi každých 55 sekund a 65 sekund. Záměrem je pomoci distribuovat zatížení serveru, když je naplánováno mnoho služeb ve stejných intervalech.

Monitor Monitor-name [arg ...]
Monitor klíčovým slovem následuje jméno skriptu a argumenty Udává monitor spustit po vypršení časovače. Při určování argumentů, které mají být odeslány do skriptu monitoru, jsou dodržovány konvence citace ve skořápce. Skript je vyvolán z adresáře zadaného s argumentem -s a všechna následující slova jsou dodávána jako argumenty pro monitorovací program, za kterým následuje seznam hostitelů ve skupině, na kterou odkazuje aktuální sledovací skupina. Pokud řádek monitoru končí „;;“ jako samostatné slovo nejsou hostitelské skupiny při vyvolání programu připojeny k seznamu argumentů.

allow_empty_group
Možnost allow_empty_group umožní spuštění monitoru, i když je hostitelská skupina pro tyto hodinky prázdná z důvodu deaktivovaných hostitelů. Výchozí chování není vyvolání monitoru, když byli deaktivováni všichni hostitelé v hostitelské skupině.

description descriptiontext
Text Následující popis je dotazován klientské programy přešlo k záznamům a monitorů pomocí proměnné prostředí. Měl by obsahovat stručný popis služby, vhodný pro zahrnutí do e-mailu nebo na webovou stránku.

hostitel_hostitele výjimky [hostitel ...]
Jakékoli hostitelů uvedené po exclude_hosts bude ze servisní prohlídky vyloučena.

exclude_period periodspec
Neprovádějte plánovaný monitor v době určené periodou .

závislý výraz
Depend klíčové slovo se používá k určení výraz závislost, který je vyhodnocen jako pravdivý buď falešně, v booleovské smyslu. Závislosti jsou skutečné výrazy Perlu a musí dodržovat všechna syntaktická pravidla. Výrazy jsou vyhodnoceny ve vlastním prostoru balíčku, aby náhodně neměly nějaký nežádoucí vedlejší účinek. Pokud je při vyhodnocení výrazu nalezena syntaktická chyba, je zaznamenána pomocí syslogu.

Před vyhodnocením se ve výrazu vyskytují následující substituce: fráze, které vypadají jako „skupina: služba“, jsou nahrazeny hodnotou aktuálního provozního stavu dané určené služby. Tyto substituce opstatus se počítají rekurzivně, takže pokud služba A závisí na službě B a služba B závisí na službě C, pak služba A závisí na službě C. Úspěšné provozní stavy (které se vyhodnocují jako „1“) jsou „STAT_OK“, „STAT_COLDSTART "," STAT_WARMSTART "a" STAT_UNKNOWN ". Slovo „SELF“ (ve všech velkých písmenech) lze použít pro skupinu (např. „SELF: service“) a je zkratkou pro aktuální skupinu hodinek.

Tuto funkci lze použít k řízení výstrah pro služby, které jsou závislé na jiných službách, např. Test SMTP, který je závislý na tom, zda je stroj ping dosažitelný.

dep_behavior {a | m}
Vyhodnocení grafů závislosti může řídit potlačení výstrah nebo sledování vyvolání.

Potlačení výstrahy . Pokud je tato možnost nastavena na „a“, bude výraz závislosti vyhodnocen po ukončení sledování služby nebo po přijetí pasti. Výstraha bude odeslána, pouze pokud vyhodnocení proběhne úspěšně, což znamená, že žádný z uzlů v grafu závislosti nenaznačuje selhání.

Sledujte potlačení . Pokud je nastavena na "m", bude závislost výrazu evakuován před spuštěním monitoru služby. Pokud bude evakuace úspěšná, bude spuštěn monitor. V opačném případě nebude monitor spuštěn a stav služby zůstane stejný.

 

Definice období

Období se používá k definování podmínek, které by měly umožnit doručení výstrah.

period [label:] periodspec
Období seskupuje jeden nebo více poplachů a proměnných, které řídí, jak často se výstraha stane, když dojde k poruše. Klíčové slovo období má dvě formy. První vezme argument, který je specifikací období z modulu Patrick Ryan Time :: Period Perl 5. Další informace naleznete v části „perldoc Time :: Period“.

Druhý formulář vyžaduje štítek následovaný specifikací období, jak je definováno výše. Štítek je značka skládající se z abecedního znaku nebo podtržítka následovaná nulou nebo více alfanumerickými znaky nebo podtržítka a končící dvojtečkou. Tento formulář umožňuje více období se stejnou definicí období. Jedno použití je mít definici dobu, která nemá žádný nebo alertafter alertevery parametry pro určité časové období, a druhý pro stejné časové období s jinou sadu záznamů, které se obsahují tyto parametry.

alertevery timeval
Klíčové slovo alertevery (v rámci definice období ) bere stejný typ argumentu jako proměnná interval a omezuje počet odesílání výstrah, když služba pokračuje v selhání. Pokud je například interval „1h“, pak se pouze upozornění v sekci období spustí pouze jednou za hodinu. Je-li klíčové slovo alertevery vynechán v položce období, bude výstraha být rozeslány pokaždé, když je detekována porucha. Ve výchozím nastavení, pokud se změní výstup dvou po sobě jdoucích selhání, je interval alertevery přepsán. Je-li slovo „shrnutí“ posledním argumentem, budou při porovnávání výstupu opakovaných selhání brány v úvahu pouze souhrnné výstupní řádky.

alertafter num

alertafter num timeval
Klíčové slovo výstrahy po (v sekci období ) má dvě formy: pouze s argumentem „num“ nebo s argumenty „num timeval“. V první podobě bude výstraha vyvolána až po „num“ po sobě jdoucích selháních.

Ve druhé podobě jsou argumenty kladné celé číslo následované intervalem, jak je popsáno výše uvedenou proměnnou intervalu . Pokud jsou tyto parametry zadány, budou upozornění na toto období vyvolána až poté, co v daném intervalu dojde k mnoha selháním. Například, pokud výstraha bude dána argumenty „3 30 m“, výstraha bude vyvolána, pokud dojde k třem selháním do 30 minut.

numalerts num

Tato proměnná říká serveru, aby během selhání nevolával více než num upozornění. Počitadlo výstrah je uchováváno na periodě a po každém úspěchu je resetováno.

comp_alerts

Je-li tato možnost zadána, vyvolá se upalerts pouze v případě, že bylo vyvoláno odpovídající upozornění na „down“.

výstražné upozornění [arg ...]
Období může obsahovat více upozornění, která se spouští při selhání služby. Výstraha je specifikována klíčovým slovem výstrahy , následovaným volitelným parametrem exit a argumenty, které jsou interpretovány stejně jako definice monitoru , ale bez znaku ";;" výjimka. Parametr exit má podobu exit = x nebo exit = xy a má za následek, že se výstraha vyvolá pouze v případě, že stav ukončení monitorovacího skriptu spadá do rozsahu parametru exit . Pokud je například výstražným řádkem výstraha exit = 10-20 mail.alert mis, pak bude upozornění mail vyvoláno s mis jako argumenty, pokud je výstupní hodnota monitorovacího programu mezi 10 a 20. Tato funkce umožňuje spustit různá upozornění na různých úrovních závažnosti (například když volné místo na disku klesne z 8% na 3%).

V části ALERT PROGRAMY výše najdete seznam pramaeters mon, který automaticky předá výstražné programy.

upalert alert [arg ...]
Upalert je doplňkem výstrahy . Upalert je volán, když služby způsobí přechod státu z neúspěchu do úspěchu. Upalert skript se nazývá dodávající stejné parametry jako varovný skript, s přidáním parametru -u, který se jednoduše používá, aby varovný skript věděl, že je volán jako upalert. Pro každou definici období lze zadat více upalertů. Vezměte prosím na vědomí, že výchozí chování je, že upalert bude odeslán bez ohledu na to, zda došlo k nějakým předchozím "down" upozorněním, protože upalert se spustí při přechodu na stav. Nastavte možnost comp_alerts za období tak, aby spárovala upalerts s upozorněními „down“.

výstraha při spuštění [arg ...]
Startalert je volán pouze v případě, že mon server spustí spuštění.

upalertafter timeval
Parametr upalertafter je určen jako řetězec, který sleduje syntaxi intervalu parametru ("30s", "1m" atd.) A řídí spouštění upalert . Pokud se služba vrátí zpět po výpadku po dobu delší nebo rovnou hodnotě této možnosti, bude vyvolán upalert . Použijte tuto možnost, chcete-li zabránit vyvolání upozorňování kvůli „výkyvům“ (krátké výpadky).