Nelja aastase VMware Cloud pilveteenuste pakkumise kogemuse baasil oleme näinud mitmeid olukordi, kus kliendi teenuse töö on olnud häiritud kliendipoolsest virtuaalmasina haldamise teadmatusest. Teadmatuse all mõtleme eelkõige parimate tavade puudulikku järgimist. Toome mitmed juhtumid üldistatud kujul nüüd siia blogipostitusse kokku, et oleks hea nii meelde tuletada, kui ka uusi teadmisi saada. Peamiseks kasuteguriks kliendile on eelkõige ülevaade parimatest tavadest ja suurematest vigadest, mida vältida VMware Cloud platvormil.
VM Virtual Hardware Version
Parima tava kohaselt tuleb kasutada kõige uuemat hardware versiooni. See tagab kõige parema ühilduvuse WaveCom´i uusima vSphere platvormiga ja võimaldab kasutada vastavaid uuemaid featuure, mis kiirendavad oluliselt virtuaalmasinate tööd.
VMware vSphere uueneb pidevalt. Vähemalt üks kord aastas tekib uus hardware versioon. Versiooni saab muuta virtuaalmasina alt “All actions -> Upgrade Virtual Hardware Version” (enne tuleb virtuaalmasin seisma panna).
Kui kasutada väga vana hardware versiooni (madalam kui v14), võib arvestada tõsiste virtuaalmasina operatsioonisüsteem (OS) vigadega ja vigadega virtuaalmasina juhtimisel Cloud Directory platvormil.
Vananenud versioon võib mõjutada ka Availability tööd virtuaalmasina varundamisel ja taastel.
Seisuga 05.03.2021 on hardware vaikeversioon v18, seega on mõistlik virtuaalmasinad uuendada samale versioonile.
Operating System defineerimine
Ühilduvusprobleemide vältimiseks tuleb alati defineerida õige OS. Kui on defineeritud Centos 6 või lihtsalt Linux ja tegelikult on OS-na kasutusel Centos 7 (või uuem), siis varem või hiljem tekivad probleemid. OS-i saad määrata “Virtual Machine - > General -> Edit”.
VMware Tools
Virtuaalmasinatel on kohustuslik kasutada VMware Tools´i. Pakett sisaldab hädavajalikke draivereid (võrk, ketas, graafika jne). WaveCom´i pakutavatel templiitidel on Vmware Tools paigadatud.
Linux´id kasutavad open-vm-tools paketti, mille uuendused tulevad kaasa OS uuendustega. Seega ei ole vaja lisaks teha, kui hoida enda OS-d uuendatuna. Lihtsalt jälgige et see olemas oleks.
Windows serveritel tuleb seda uuendada ise ja see on online tegevus, mis restarti ei vaja. Uuendamiseks vali “Virtual Machine -> Actions -> Install VMware Tools”. Peale valikut mounditakse uus installer ja saate juba OS-is teha uuenduse kasutades wizardit.
Ilma VMware Tools´ta ei toimi näiteks VMXNET võrk ühelgi virtuaalmasinal ja näiteks puudub hiir Windows konsoolis.
VMware vSphere uueneb pidevalt ja uusi Tools´i versioone tuleb mitmeid kordi aastas.
Storage policy´d
Tungivalt soovituslik on kasutada virtuaalmasinal sama storage policy´t nii virtuaalmasina failidel kui ka ketastel.
VMware Cloud lubab hoida virtuaalmasina konfiguratsiooni ja swap faile eraldi asukohtades, ning määrata eraldi asukoht ka erinevatele ketastele. Samas on virtuaalmasina hoidmisel eri asukohtades tegu halvima võimaliku praktikaga.
Ühe storage policy rikke või ülekoormuse korral põhjustab selline praktika virtuaalmasina töö seiskumise ja ka võimaliku andmekao mida muidu ei juhtuks.
Storage policy virtuaalmasina failidele ja swapile saada määrata “Virtual Machine –> General -> Edit”. Ketastele saab seda määrata “Virtual Machine -> Hard Disk -> Edit” alt. Seal soovitame kasutada “VM default policy”, ehk see mis on määratud ka konfiguratsiooni failidele “General” all. Siis saab ka lihtsamalt teha reaalajas virtuaalmasina ülekannet teisele storagele, määrates uue policy ainult “General” all.
Lisaks ei ole soovituslik ilma tungiva vajaduseta mitte kunagi teha virtuaalmasinale mitmeid diske või hoida erinevaid diske erinevate policy´te peal.
See aeglustab märgatavalt virtuaalmasina latentsi ja võib põhjustada isegi OS vigu.
WaveCom´i pakutav “TIER2 storage” pole mõeldud virtuaalmasinale mountimiseks vaid eelkõige templiitide, iso tõmmiste ja näiteks käigust maas olevate virtuaalmasinate hoidmiseks.
Tegemist ei ole kõrgkäideldava storage´ga. Hoolduste ajal policy muutub kättesaamatuks ja virtuaalmasin kuhu see on mounditud võib hanguda.
Mounted CD-ROM
Ärge unustage haagituks ISO tõmmist. Halvemal juhul ei ole virtuaalmasin hiljem võimeline startima ja siis on vajalik toe sekkumine.
Jättes ISO haagituks, siis “TIER2 storage´l” hoolduse ajal võib virtuaalmasinas tekkida tõrkeid.
Virtuaalmasinate andmeid saad lihtsalt kontrollida kui export´da nende nimekiri .csv faili. Selleks mine “Virtual Machines -> paremal üleval vali virtuaalmasinate näitamine nimekirjas (pildil) -> Export VMs”.
Snapshot - see ei ole backup
Snapshot ehk momentvõte on hea moodus virtuaalmasina seisu salvestamiseks. Eelkõige soovitame seda kasutada ainult lühiajaliselt tarkvarauuenduste puhul, millel on oht probleemide tekkeks.
Snapshoti loomisel moodustatakse delta fail kuhu kirjutatakse kõik ketta muutused peale snapshoti loomist. Snapshoti kustutamisel konsolideeritakse muutused tagasi virtuaalmasina kettale.
Snapshoiti loomiseks peab olema kettal kaks korda sama palju ruumi kui on virtuaalmasina suurus. Vastasel juhul “Snapshot´i” ei looda. Tasub meeles pidada, et hoides “Snapshot´i” üle paari päeva, siis muutub kettasüsteemi kiiru ca 2 korda aeglasemaks. Näiteks, kuu aega vana “Snapshot” võib kettasüsteemi teha neli korda aeglasemaks. Mingil hetkel lõppeb see võimaliku virtuaalmasina katki minekuga ja andmekaoga.
Kasuta “Snapshot´i” omal vastutusel ja ära unusta selle kustutamist niipea kui võimalik.
Sama funktsiooni täidab ka Cloud Director Availability, kus saab fikseerida restore punkte. Siiski tuleks Availability salvestatud punkt eemaldada koheselt, kui seda ei ole enam vaja. Vastasel korral muutub varundus peale paari nädalat kasutuks ja seda ei saa enam kasutada taastamiseks.
Compute skaleering
Meie teenus võimaldab vCPU ja vRAM kogust lisada kuumalt, kui on aktiveeritud “hot add” funktsioon.
Kui “Virtual CPU Hot add” on välja lülitatud, siis on virtuaalmasin ca 7% kiirem,
Lisaks on Windows serveritel mitmeid buuge mis kaotavad drastiliselt aktiivse cpu hot add funktsiooniga kiirust.
Muutmiseks tuleb masin välja lülitada ja “Compute” alt cpu ja mälu sektsioonis “hot add” lubada või keelata. Mälu osas soovitame “hot add” hoida aktiivsena
Linux´i kernel piirangute tõttu ei saa töötavale virtuaalmasinale (kus on alla 4GB ram mälu) lisada rohkem kui 4Gb mälu.
Selleks, et piirangust vabaneda, tuleb virtuaalmasin välja lülitada ja suurendada mälu üle 4GB.
Peale seda saab töötaval virtuaalmasinal mälu suurendada probleemivabalt.
Võrgud
Kui on vajadus muuta, lisada, kustutada võrku või ip aadressi, siis soovitame alati valida “IP Pool”. Sellisel juhul antakse virtuaalmasinale esimene vaba IP Teile määratud IP vahemikust. Võite valida ka “Manual IP” ning ise selle määrata. Mõlemal juhul seadistab automaatika võrguseaded OS-s kui kasutada “force recustomization” võimalust. Me ei soovita DHCP kasutamist. Kui siiski soovite seda teha peate eelnevalt vastavad teenused seadistama.
Võrkudega on väga lihtne saada ka tulemüüri blokeering, kui vahetate OS-s IP aadressi, millest Cloud Director ei ole teadlik ehk puudub vastav võrk ja ip vcloud directoris.
Või kui panete OS-le IP, mis on juba kasutusel mõnes teises masinas. Seda saab eemaldada ainult klienditugi.
Suured koormused ehk lärmakas naaberlus
WaveCom´i pilveteenus on jagatud keskkond ja mõeldud madalat latentsi vajavate ärikriitiliste rakenduste majutamiseks. Keelatud on virtuaalmasinas CPU ja IO ressurssidele ebamõistlikult suurte koormuste tegemine.
Suuri koormusi põhjustavad alaprovisioneeritud virtuaalmasinad, kus CPU-de võimekus on pidevalt ületatud, sest on valitud vajalikust oluliselt väiksemad mahud. Näiteks olukord, kui serveril on 4 CPU tuuma kuid koormus on 8. See tähendab, et CPU-de arv ei ole piisav ja tekib järjekord CPU ajale. Kui aga koormus suureneb juba 16-ni või rohkem, siis on juba tegu teenustõkke ründele sarnaneva olukorraga. Sellisel juhul ei toimi ka antud masina teenused.
Suurt koormust põhjustavad ka näiteks pikemad benchmark testid ja skriptid, mis viivad kõikide virtuaalmasinate CPU-de tuumade koormuse või IO maksimumini ning ületavad seda. Eelkõige peame silmas olukorda, kus test ei ole piisavalt läbi mõeldud ja mõistlikult teostatud või kasutatakse vahendeid, mis seda ei võimalda. Vajadusel saame alati võimaldada pikemaid ja mahukamaid teste liigutades test virtuaalmasina sobivale hostile, kus teiste klientide häirimine on minimaalne.
Samuti ei ole meie platvorm mõeldud mahukatele varundusrakenduste majutamiseks, isegi kui need töötavad ainult öötundidel. Suuremahuliste varundusrakenduste majutamiseks pakume teisi võimalusi nagu privaatserver (või teised lahendused), mis on enamjaolt ka oluliselt soodsamad.
vCloud Availability
Tõsiste probleemide vältimiseks tuleb vältida varunduse tegemist production virtuaalsesse andmekekusesse (vDC).
Selle jaoks on WaveCom´l olemas vastav teenus, millega kaasneb “dedicated DR vDC”. Availability´t kasutades tuleb varundada alati varu/replikeerimise saidile. Vastasel juhul paneb varundus storage´le ja võrgule väga suure koormuse, mis häirib production vDC virtuaalmasinate tööd. Kui oled siiski seda teinud ja veel ka production storage policy´le, siis võib väga lihtsalt saada vDC storage ruum täis, millest omakorda algavad tugevad anomaaliad.
Availability jälgib virtuaalmasina muutunud blokke, millest tehakse deltad sihtsaidis vastavalt seadistatud recovery time objective´le (RTO).
Kui oled suurema kettaga virtuaalmasinal kustutanud sisu ja loonud uue sisu, siis on taastamine viimasele RPO-le aeglane ja võib esineda vigu. Vead juhtuvad, sest reaalselt ei saa virtuaalmasin koosneda suurest kettast ja suurest deltast. Kui andmed konsolideerida taastades, siis loetakse delta masina kettaks ja taastamine on võimalik. See võib suuremal ketta puhul aega võtta tundide. Pikemate varundusaegade puhul pigem eemaldage replikatsioon ja tehke see uuesti.
Parimaks tavaks on varunduse pidev kontroll ja testimine.
Juba eelmainitud tegevus võib tekitada tõsiseid probleeme. Mõistlik on kord kuus teha failover test, et hinnata taaste kiirust ja konsistentsust. Testi käigus käivitatakse soovitud vApp´id või virtuaalmasinad DR andmekeskuses kuid nende võrgud isoleeritakse. Võrgud on samaaegselt kättesaadavad taastatud virtuaalmasinatele, mis võimaldab omakorda veenduda teenuste toimimises taastatud keskkonnas.
Availability võimaldab fikseerida restore punkte. Siiski tuleks Availability salvestatud punkt eemaldada koheselt, kui seda ei ole enam vaja. Vastasel korral muutub varundus peale paari nädalat või kuud kasutuks ja seda ei saa enam taastamiseks kasutada.
Kindlasti soovitame sisse lülitada vCloud Availability teated, mida saab teha menüüs "Events -> Notifcations". Nii saate enda meilile tähtsad teavitused varunduse tööst ja võimalikest häiretest.