SaaS-számítási feladatok incidenskezelése az Azure-ban
A szolgáltatásként nyújtott szoftverek (SaaS) megoldásainak független szoftvergyártóknak (ISV-k) kell üzemeltetniük a megoldást az ügyfeleik számára. Ehhez olyan szervezeti beállításra és kultúrára van szükség, amely zökkenőmentesen kezeli a váratlan éles helyzeteket. Tervezőként ennek megfelelően kell megterveznie a felügyeleti folyamatokat és eszközöket.
Ez a cikk bemutatja, hogyan igazíthatja a szervezet kulturális környezetét, folyamatait és eszközeit egy éles SaaS-megoldás incidenskezelésének támogatásához.
A szolgáltatói feladatok ismertetése
Az SaaS-megoldás üzemeltetése azt jelenti, hogy Ön az ügyfelek 24x7 informatikai és üzemeltetési részlege. A megfelelő személyzettel, kultúrával, folyamatokkal és eszközökkel kell felkészülnie.
Kialakítási szempontok
Felelősséget vállal a 24x7x365 támogatásért. Az SaaS-megoldások használatához a szervezetnek mindig fel kell készülnie az incidensekre. Ez az előkészítés magában foglalja a csapattagok rendelkezésre állását, mivel az incidensek munkaidőn kívül is előfordulhatnak.
Az élő hely támogatása magában foglalja a rendszer rendelkezésre állását, biztonságát, teljesítményét vagy üzembe helyezését befolyásoló incidensek valós idejű monitorozását és megválaszolását. Ön vagy ügyfelei észlelhetik ezeket az incidenseket. Az ilyen incidensek kezeléséhez speciális készségekre van szükség, beleértve a nyomás alatt lévő problémák elemzésének és megoldásának képességét.
Az élő webhely támogatása stresszes lehet, és fontos, hogy támogassa a csapattagokat. Ha a csapat még nem érte el ezt a felelősséget, gondosan tervezze meg az átállást. Az incidensek során felmerülő ügyeleti feladatokra, kártérítésre és az elérhetetlenség kezelésére vonatkozó aggodalmak kezelése.
Kockázat: Készség- és elváráskezelés. Nem minden mérnök alkalmas 24x7x365-ös támogatási szerepkörre. Ha már meglévő csapatot vált át egy SaaS-megoldás támogatására, győződjön meg arról, hogy megfelelő elvárásokat támaszt, és oktatási lehetőségeket biztosít.
Élőhelyi kultúra intézete. Fontolja meg a támogatási esetek és incidensek kezelését, valamint az eszkalációk előfordulását. A cél annak biztosítása, hogy a csapattagok megértsék feladataikat, és rendelkezzenek az incidensek kezeléséhez szükséges készségekkel és eszközökkel.
Előfordulhat, hogy a startupok és a kisebb szervezetek egyszerűsített tervet használnak az élő helyek problémáira. A mérnökök kezdetben frontvonali támogatásként szolgálhatnak az ügyfélszolgálati esetek megválaszolásával. Az érett szervezeteknek vagy vállalati ügyfelekkel rendelkező SaaS-szolgáltatóknak strukturáltabb támogatásra és dedikált csapatokra van szükségük.
Kompromisszum: A működési kiválóság és a költségek. Az élő webhely eseményeinek kezelése az új funkciók vagy hibajavítások fejlesztési idejéből is visszavetheti a időt. Ha a fejlesztési sebesség aggodalomra ad okot, fontolja meg a dedikált élőhelyi erőforrások felvételét.
Tervezési javaslatok
Ajánlás | Juttatás |
---|---|
Bevezetés egy frontvonali csapatba a támogatási esetek kezeléséhez. Összetett esetekben ez a csapat összegyűjti azokat az információkat, amelyekre a mérnöki csapatnak szüksége van a vizsgálatához. A szállítók az előtérbeli támogatási csapatként szolgálhatnak, és elvégezhetik a kezdeti problémaelemzést, és megoldhatják az egyszerű problémákat. |
Elkerülheti a mérnöki csapat túlterhelését incidenskezelési feladatokkal és a rendszeres feladataik megszakításával. |
A mérnökök számára egy ügyeletes funkcióba fektethet be, amely összetett eseteket kezel, kivizsgál és intézkedik. Ha lehetséges, forgassa el az ügyeleti feladatokat a csapattagok között, és minden mérnök egyszerre néhány napig legyen ügyeletben. |
Jól definiált felelősségekkel és eszkalációs útvonalakkal gyorsan azonosíthatja és kezelheti a problémákat anélkül, hogy megzavarná a mérnöki munkafolyamatot. |
Az incidenskezelésre specializálódott eszközök beszerzése. Győződjön meg arról, hogy minden válaszadó rendelkezik hozzáféréssel az eszközök hatékony használatához és megértéséhez. Válassza ki a rendszerállapot figyelésére, az ügyfél által jelentett problémák nyomon követésére, a problémák azonosítására, az ügyeletes mérnökökre való eszkalálásra, a nem válaszoló mérnökök kezelésére és az éles környezetben végzett módosítások engedélyezésére alkalmas eszközöket. |
A megfelelő eszközökkel az ügyeleti csapat gyorsan azonosíthatja és megoldhatja az incidenseket a biztonság és az üzemeltetés felügyelete mellett. |
Javíthatja a monitorozást, az üzembe helyezéseket, a frissítéseket és az egyéb rendszeres felügyeleti műveleteket. | A működési érettségbe való befektetéssel csökkentheti az élő helyek problémáinak valószínűségét. Ha problémák merülnek fel, a jól definiált műveletek végrehajtása lerövidíti a megoldási időt. |
A válaszcsomag meghatározása
Vegye tudomásul, hogy az incidensek elkerülhetetlenek, és felkészülnek rájuk egy incidenskezelési terv meghatározásával. Ez a proaktív megközelítés megakadályozza, hogy válaszstratégiát dolgozzon ki az első incidens során.
Tervezze meg előre a főbb incidenseket, amelyek általában befolyásolják az ügyfelek szolgáltatásának használatát. Ez az előkészítés segít minimalizálni a stresszt és az összetettségeket az incidensek előfordulása esetén.
Kialakítási szempontok
Adja meg az eszkalációs útvonalat. Győződjön meg arról, hogy a csapatok megértik a támogatási feladatok eszkalációs folyamatát. Számos SaaS-megoldásban az ügyfelek kapcsolatba lépnek egy frontvonali támogatási csapattal, amely ezután kommunikál a mérnöki csapattal. Győződjön meg arról, hogy az ügyfelek tudják, hogy kivel és miért nem szabad megkerülniük ezeket a folyamatokat. Emellett győződjön meg arról, hogy a mérnöki csapat tudja, mikor és hogyan kérhet segítséget a szállítóktól, beleértve a Microsoft támogatási csapatait is.
Súlyossági szintek meghatározása. A különböző incidensek különböző jelentőséggel bírnak Ön és ügyfelei számára. A fő éles üzemkimaradás kezelése eltér attól, ahogyan egy kisebb hibát kezel. Határozza meg a súlyossági szinteket az ügyfelek hatása alapján, és állítsa be a megfelelő elvárásokat és ütemterveket az egyes szintekhez.
A triázshoz szükséges dokumentumadatok. A hatékony incidenskezeléshez elengedhetetlen a dokumentáció naprakészen tartása. Ez a dokumentáció tartalmazza a rendszer architektúraelrendezését, az összetevőszintű részleteket, a tulajdonosokat és a legfontosabb névjegyeket. A pontatlan vagy elavult információk miatt az incidenskezelő csapat értékes időt pazarolhat a rendszerműveletek, a felelősségek és az incidens lehetséges hatásainak feltárására.
Tervezze meg az ügyfelekkel való hatékony kommunikációt. Az állapotfrissítések megadása kulcsfontosságú az incidenskezelésben. Az állapotfrissítések segítenek az ügyfeleknek megérteni az incidensek természetét, és csökkenteni a hasonló problémákat tapasztaló ügyfelek támogatási eseteinek mennyiségét.
Tervezési javaslatok
Ajánlás | Juttatás |
---|---|
Biztosítson egyértelmű incidensjelentési folyamatot, például egy támogatási esetet az előtérbeli támogatási csapatnál az ügyfelek számára. | Biztosítja az incidensek felderítésének és elhárításának konzisztenciáját, ami csökkenti a megoldáshoz szükséges időt, és megakadályozza az információk elvesztését vagy figyelmen kívül hagyását. |
Dokumentálja az architektúra elrendezését, az összetevőszintű részleteket, az adatvédelmi vagy biztonsági besorolásokat, a tulajdonosokat és a kulcspartnereket. | A triage csapat könnyen elérhető információkkal rendelkezik, és a vizsgálatokra és a hatások értékelésére összpontosíthat. |
Győződjön meg arról, hogy az incidenskezelési csapat hozzáfér a szükséges eszközökhöz és rendszerekhez, például a naplókhoz. Emellett egy biztonságos és szabályozott folyamaton keresztül képesnek kell lenniük az éles módosításokra. | Gyorsabban állíthatja vissza a műveleteket, ha biztosítja, hogy a csapat ne fogyjon időt. |
Használjon kereskedelmi állapotlapot ahelyett, hogy sajátot hoz létre. | Időt takaríthat meg egy kereskedelmi állapotlap használatával. Egy másik szervezet által üzemeltetett állapotlap is elérhető marad az ügyfelek számára a rendszerkimaradás során. |
Incidensek módszeres kezelése
A meghatározott tervhez való igazodás elengedhetetlen ahhoz, hogy a válaszidő alatt elkerüljük az improvizációt. Ez a megközelítés segít minimalizálni az ilyen helyzetek kezelésének stresszét és összetettségét.
Kialakítási szempontok
Incidens súlyosságának hozzárendelése. Az incidens súlyosságának meghatározásához használja az incidenskezelési tervet. Az ügyfelek gyakran frusztráltak az incidensek során. Fontos, hogy tisztában legyen azzal, hogy milyen hatással vannak a számukra, hogy rangsorolhassa őket. Egyértelműen közölje az incidens súlyosságát, hogy az ügyfelek reális elvárásokkal rendelkezzenek.
Maradj nyugodt és gondolkodj tisztán. Az incidensek stresszesek és nem egyértelműek lehetnek, és több érdekelt fél is figyelmet igényel. Legyen egyértelmű folyamata annak, hogy ki veszi át az vezetést egy incidensen belül. A triage incidensek a lehető legjobbak, miközben elismerik, hogy nem tökéletes információkkal kell működnie. Próbálja meg kézben tartani a helyzetet.
A szervezeti vezetők segíthetnek az incidenseket aktívan kivizsgáló vagy enyhítő csapattagok megvédésével.
Állapot közlése az ügyfelekkel. Frissítse az állapotlapot, hogy elegendő információt tegyen közzé. Azonnal kommunikáljon, és adja meg a szükséges információkat, például a becsült feloldási időket. Gyakori frissítéseket adhat az ügyfeleknek a bizalmuk fenntartásához.
Tervezési javaslatok
Ajánlás | Juttatás |
---|---|
Incidens során rangsorolja a helyreállítást a felderítéssel szemben. Incidens esetén fontossági sorrendbe kell állítani a műveletek gyors visszaállítását, hogy minimálisra csökkenjen az ügyfelek zavarása. |
Előfordulhat, hogy egy érintett összetevő útválasztásával vagy frissítés visszaállításával is helyre tud állni, még akkor is, ha még nem tudja, mi okozta a problémát. |
Adjon meg időben, egyértelmű és gyakori frissítéseket a kimaradások során. | Megadhatja az ügyfelek bizalmát, és csökkentheti az előtérbeli támogatási csapat terheit. |
Jelöljön ki egy kommunikációs vezetőt egy aktív incidens során. Ez a vezető egyetlen személy lehet, vagy előfordulhat, hogy a csapattagok felelősségét az incidensek között elforgatja. | Ha egyetlen hangot ad a mérnöki csapatnak, központosíthatja a beszélgetéseket, és csökkentheti a zavaró tényezőket a többi csapattag számára. Azt is megakadályozhatja, hogy egy kaotikus incidens során ütköző információk jussanak el az ügyfelekhez vagy az érdekelt felekhez. |
Győződjön meg arról, hogy kritikus fontosságú támogatási csomaggal rendelkezik az olyan gyártók számára, mint a Microsoft. | Ha leállás történik, rugalmas kommunikációra van szüksége a platform gyártóival, például a Microsofttal, hogy könnyebben megállapíthassa a probléma helyét, és lerövidítse a kimaradás időtartamát. |
Incidens utáni felülvizsgálatok elvégzése
Miután felépült egy incidensből, tekintse át és elemezze, hogy mi történt, hogy tanuljon belőle. Olyan szervizelési műveletek implementálása, amelyek technikai módosításokat, folyamatmódosításokat vagy több betanítást is tartalmazhatnak.
Kialakítási szempontok
Tanuljon az incidensekből. A kimaradások értékes tanulási lehetőségeket kínálnak. Az incidensek után alapos felülvizsgálatokat végezhet a tanulságok azonosítása és a fejlesztések megvalósítása érdekében. A nagyobb incidenseknek gyakran több oka is van. Annak kiértékelése, hogy a megoldás más rétegei, például az üzemeltetési folyamatok megelőzhetik-e vagy észlelhetik-e a problémát, mielőtt az eszkalálódna. Emellett keressen hasonló mintákat a megoldás más részein is, amelyek szintén ugyanazon probléma kockázatának lehetnek kitéve.
Kommunikáljon az ügyfelekkel. Számos független szoftverszállító biztosítja az incidens utáni kommunikációt, különösen azoknak a vállalati ügyfeleknek, akik magas színvonalú frissítéseket várnak. Legyen átlátható, és elegendő információt biztosítson az ügyfelek számára a probléma és a megoldás lépéseinek megértéséhez. A biztonság és az integritás fenntartása érdekében azonban kerülje a megoldásarchitektúra vagy -összetevők túlzott belső részleteinek megosztását.
Tervezési javaslatok
Ajánlás | Juttatás |
---|---|
Hozzon létre egy folyamatot az incidens utáni belső felülvizsgálatokhoz. Összpontosítson a probléma okainak azonosítására. Fontolja meg a technikai okokat, azt, hogy a folyamatok hogyan járulhattak hozzá a kimaradáshoz, és hogyan reagált az incidensre. |
Az incidens utáni belső felülvizsgálatok segítenek megismerni az éles üzemkimaradásokat, és minimalizálni a hasonló problémák újbóli előfordulásának kockázatát. |
Hozzon létre egy strukturált tervet a szervizelésre szoruló elemek kezelésére. Adjon meg egyértelmű elszámoltathatóságot és ütemterveket. | Az egyértelmű elszámoltathatóság biztosítja, hogy minden szerepkör megfeleljen a funkcionális elvárásainak, fokozza az egyértelműséget, és lehetővé teszi a kívánt szinteken történő transzparens jelentéskészítést. |
Ügyféloldali incidens utáni felülvizsgálatok közzététele. Biztosítson az ügyfeleknek elegendő részletet a probléma és a megoldási lépések megértéséhez anélkül, hogy szükségtelen belső részleteket vagy rendszerarchitektúrát tárnak fel. Az incidens utáni kommunikációt mindig emberek írhatják és tehetik közzé. A műszaki és nem műszaki érdekelt feleknek a pontosság és az egyértelműség érdekében felül kell vizsgálniuk a közleményeket. |
Ez a megközelítés segít fenntartani az ügyfelek bizalmát, és biztosítja őket arról, hogy ön tanult az incidensből, és kezeli az azonosított problémákat. |
Következő lépés
A tervezési területek áttekintése után folytassa az értékelési eszközzel a terv kiértékeléséhez.