Monitooring. Mis see on? Mida see annab?
Monitooring on vajalik, et jälgida infosüsteemi ja selle komponentide tööd reaalajas, kusjuures andmete tõlgendamiseks on vajalik ka teatud andme-ajaloo olemasolu. Kuivõr erinevatelt inimestelt? Kuivõrd erinevatel hetkedel? Kuivõrd on kuuldu subjektiivne, kuivõrd objektiivne? St.selleks, et kontrollida lihtsat väljaütlemist on vaja palju andmeid. Mis oli täpselt aeglane? Mis sa samal ajal arvutis tegid? Mis kell see oli? Millega võrreldes aeglane? Kui tihti seda esineb? Jne. Loomulikult jõuavad need probleemid eskalleerumisel IT spetsialistideni. Oletame, et infosüsteemi “uimase oleku” tõttu peab iga töötaja tegema mõnda liigutust 5 sekundit kauem, oletame, et neid liigutusi on päevas 50 korda ja oletame, et neid töötajaid on 20. Palju see ühes kuus teeb? 5x50x20x20=~27h tööd ühes kuus. Oletame, et see argument ei ole eriti kõnekas. Mis oleks see aasta lõikes? 324h tööd – see teeb kaks kuupalka umbes? Selle mõttega tasub mängida. Loomulikult ei ole need sekundid iga ametikohal niivõrd määravad.
Mis te arvate kui tihti IT spetsialist kuuleb, et arvutikasutaja arvuti on aeglane?
Oletame, et teie asutuse infosüsteemis on 5 füüsilist serverit, igal serveril on paar kõvaketast. Infosüsteemid on omavahel seotud – ühel neist asuvad toote andmed, ühel laoseis, ühelt toimub liidestus partneritega, ühel mailiserver. Ühel heal päeval saab mailiserveri kõvaketas täis – kõik justkui toimub vigadeta. Helistad oma IT tugiisikule ja kurdad, et mailid ei tule sisse. Esimesel pilgul arvab spetsialist, et ju mailid jäid kuskile “toppama” ning tulevad hiljem. Teistkordselt helistades teatab ta aga, et serveri kõvaketas on täis ning server jooksis kokku – töötavad vaid need mailikastid, mis on serveril mälus, ehk “meeles”. Asutakse probleemi kallale. Serverile tehakse restart ning peale restarti selgub, et sellel ajal kui ketas täis oli ei kirjutatud kettale uusi maile – teil on aga asutuses 300 töötajat. Hea küll, küll inimesed saadavad mailid uuesti. Siis aga selgub tõsiasi, et mailiserveri sees olev andmebaasifail sai kannatada – tuleb taastada varukoopialt. Loogiline, server jooksis ju kokku! Mida te aga mõtlesite kui tuleb välja, et varukoopia on samuti vigane sel lihtsal põhjusel, et kettal pole juba ammu piisavalt ruumi olnud ning see pole igapäeva töös probleeme tekitanud? Kuidas nende tundidega siis oli? Inimestel on postkastis palju räpsu – aga palju seal kasulikke töötunde on?
Tõenäoliselt lugeja juba ootas kuni jõuan selleni, et tänapäeval on võimalik monitoorida riistvara, tarkvara, erinevaid teenuseid, mõõta teenuse parameetreid jne – ja mis antud jutu juures kõige olulisem: teavitada sellest SMSi teel IT spetsialisti!
Oletame, et IT pakub ärile kassasüsteemi toimimise teenust. Selleks, et see teenus saaks toimida peab kassa pääsema asutuse võrku, võrku pääsemiseks on vaja töötavat võrgujaoturit, võib-olla mitut, töötavat serverit, sellel töötavat operatsioonisüsteemi, selles olevat teenustarkvara, selle toimimist ning ka sellelt tulenevaid advekvaatseid vastuseid – kõike seda on võimalik kirjeldada kui teenust. Puhtalt tehniline monitooringusüsteem suudab seda teha, see leiab ülesse ebasobivalt töötava võrgujaoturi, lisaks IT spetsialisti teavitamisele võiks monitooring ka teavitada, et katki ei ole mitte üks sadadest või tuhandetest seadmetest vaid ei tööta äriteenus – selle teenuse vigade puhul peaks olema reageerimisaeg oluliselt kiirem kui suvalise tähtsusetu kabinetiprinteri puhul – samuti ka valmisolekuaeg ning lahendusaeg. Võib-olla hakkasid probleemid tekkima kui lisasite selle võrgujaoturi taha töökohti? Võib-olla ei kannatanud võrguajaotur koormust enam peale voolukatkestust? Milline nendest võrgujaoturitest? Kui aga probleem oli selles, et majandustarkvara andembaasi kasvades ei jätkunud enam serveri protsessori jõudlust? Või kui kassapidaja suutis hakata mängima ressursimahukaid mänge kassal? Kõik see on monitoringusüsteemist tuvastatav.
Põhjalik monitooringusüsteem monitoorib aktiivselt kogu Teie arvutivõrku.
Pidevalt vastatakse tuhandetele küsimustele. Kas Internet on? Kas ruuter töötab? Kas serverdid töötavad? Kas serveritel olevad tarkvarateenused töötavad? Kas see kõik töötab piisvalt kiiresti? Kuidas on teenuste parameetrid aja jooksul muutunud? Jne. Sidudes see kõik äriteenustega on võimalik probleeme ennnetada, tuvastada, diagnoosida paremini, kontrollida toimivust jne. Mis te arvate kaua kulub aega leidmaks võrgust vigase võrguseadme? Mõnikord väga kaua – mõnikord saab aga monitooringuandmetele toetudes leida vea minutitega. Kui lisada siia veel juurde ka passiivne monitooring – st.seadmed saadavad ise aeg-ajalt infot – siis on võimalik väga täpne andmestik süsteemide töö kohta. Spetsialistid kutsuvad serveri töös olnud aega uptime’ks. 100% uptime on võimatu. Pigem on 99,99% süsteemide uptime 99%.
Kas süsteem oskab ka midagi ise teha vastavalt monitooringuandmetele? Jah, lihtsamaid asju saab õpetada. Näiteks ajutiste failide kustutamine kui peaks juhtuma ootamatu ketta täitumine. Teise serveri käivitamine kui üks server enam ei vasta – jne. See kõik on tehtav.
Mida veel võib monitoorimine anda? Vihjeid infosüsteemi sattumisest küberründe ohvriks. Varundusseadme täitumist? Printeri trumli vahetamisvajadust? Tahmakaseti vahetamise vajadust? Mitte töötava läbipääsusüsteemi kohta info? Surnud hoone automaatikasüsteem? Videovalvekaamera mitte töötamist? Infot, et müügiassistendi arvuti on liiga aeglane? Infot riistvara rikete kohta? Jah, jah.
Kas infosüsteemis olevad serverid on piisavalt kiired? Kas mälu on piisavalt? Kas kõvakettad on kiired? Kas logifailides on ka vajalikku infot? Kas töötajate arvutid on kiired? Jpm.
Terve asutsuse infrastruktuuri monitoorimine, probleemide märkamine enne nende ilmnemist, viivitamatud teated värsketest probleemidest, turvalekete avastamine IT süsteemi uuenduste planeerimine ning äri kahjude vähendamine või tulude suurendamine ongi monitooringu eesmärk! Võta hetk ning arvuta mõned suvalised pähe kerkivad näited rahasse…
Loomulikult on väga hea monitooring traditsiooniline sekretär – ta helistab kui asutuses jama on – aga kas seda helistamise jama on vaja nii tihti?
Näide kliendi arvutivõrgus asuvate seadmete monitooringutulemustest:
Näide konkreetse seadme monitooringust: