Demo dohledového systému

KS Dohled | Podstata služby KS Dohled | Co umíme dohlížet? | Možnosti reportování | Demo dohledového systému | Demo vizualizační nadstavby NagVis

Připravili jsme pro ukázku monitorovací nástroj, který poskytujeme v rámci služby KS Dohled. Aplikace poskytuje široké možnosti přehledů nad dohlíženými zařízeními (servery, routery, ups, teplotní a vlhkostní čidla atp.) a na nich běžícími službami (ping, load, memory atp.). Naše ukázka nabízí aktuálně pohled na jeden server a několik jeho služeb. Pokud s dohledovým systémem pracujete poprvé, doporučujeme si projít stručný popis jednotlivých kontrol (tzv. check), jimiž jsme schopni průběžně zjišťovat informace o stavu jednotlivých služeb.

Vstup do dohledového systému

Stručný popis prováděných kontrol (checks) v demo prostředí

Většina kontrol se provádí pomocí protokolu SNMP, některé lze provádět pomocí agentů nainstalovaných na kontrolovaném zařízení. Pro jednotlivá zařízení (hosts) definujeme provozní parametry a služby, na které jsou navázány kontroly zjišťující v pravidelných intervalech hodnotu sledovaných parametrů. Každému sledovanému parametru určíme dvě důležité hraniční hodnoty tzv. WARNING (varovná) a CRITICAL (kritická). Na jejich překročení jsou navázány specifické "odvetné" akce, např. notifikace formou GSM (vytáčení tel. čísla či zaslání SMS), notifikace pomocí zaslání e-mailu definovaným řešitelům či doručení notifikace do helpdeskového systému pro další zpracování.

V demo prostředí jsou dostupné jen některé základní sledované parametry. V konkrétním prostředí zákazníků lze sledovat celou řadu dalších parametrů, služeb atd.

DISK-/

Kontrola zaplnění diskové kapacity disku. V tomto případě se kontroluje disk, který má (linux/unix) mount point v adresáři '/', tedy root.
V případě, ze by na zařízení byl instalován některý z operačních systémů Windows, bude název služby DISK-C.

load

load = zatížení unix/linux systému. Skládá se ze tří údajů, je počítáno z průměrného počtu procesů čekajících na vyřízení procesorem v intervalu posledních 1, 5 a 15 minut.

memory

Přehled využití paměti v % z instalovaného množství. U linux/unix systémů je zde navíc i informace o využití swap, též v % vyjádření.

ping

Kontrola odezvy systému. Výzvy jsou odesílány na cílovou IP adresu a ve stanoveném limitu se očekává odpověď.

port-443

Kontrola odezvy portu (v našem případě https 443) a zda je otevřen.

ssl-cert-expire

Kontrola data expirace ssl certifikátu.

fc-switch

Kontrola stavu zařízení typu fiber channel switch a vyčítání průtoků dat po jednotlivých portech

traffic-int-[port-number]

Průtoky dat na konkrétním portu switche