Megosztás a következőn keresztül:


Aktív-passzív vészhelyreállítási megoldás áttekintése az Azure Kubernetes Service -hez (AKS)

Amikor létrehoz egy alkalmazást az Azure Kubernetes Service-ben (AKS), és kiválaszt egy Azure-régiót az erőforrás-létrehozás során, az egyrégiós alkalmazás. Ha a régió katasztrófa esetén elérhetetlenné válik, az alkalmazás is elérhetetlenné válik. Ha azonos üzembe helyezést hoz létre egy másodlagos Azure-régióban, az alkalmazás kevésbé lesz érzékeny az egyrégiós katasztrófákra, ami garantálja az üzletmenet folytonosságát, és a régiók közötti adatreplikáció lehetővé teszi az utolsó alkalmazásállapot helyreállítását.

Ez az útmutató az AKS aktív-passzív vészhelyreállítási megoldását ismerteti. Ebben a megoldásban két független és azonos AKS-fürtöt helyezünk üzembe két párosított Azure-régióban, és csak egy fürt aktívan szolgálja ki a forgalmat.

Feljegyzés

Az alábbi gyakorlatot belsőleg áttekintettük, és a Microsoft-partnereinkkel együtt ellenőriztük.

Aktív-passzív megoldás áttekintése

Ebben a vészhelyreállítási megközelítésben két független AKS-fürtöt helyezünk üzembe két Azure-régióban. Azonban egyszerre csak az egyik fürt szolgálja ki aktívan a forgalmat. A másodlagos fürt (amely nem aktívan szolgálja ki a forgalmat) ugyanazokat a konfigurációs és alkalmazásadatokat tartalmazza, mint az elsődleges fürt, de nem fogad el semmilyen forgalmat, kivéve, ha az Azure Front Door forgalomkezelője irányítja.

Forgatókönyvek és konfigurációk

Ez a megoldás akkor valósítható meg a legjobban, ha olyan erőforrásokra támaszkodó alkalmazásokat üzemeltet, mint például az adatbázisok, amelyek aktívan kiszolgálják a forgalmat egy régióban. Olyan esetekben, amikor mindkét régióban üzembe helyezett állapot nélküli alkalmazásokat kell üzemeltetnie, például horizontális skálázást, javasoljuk, hogy mérlegeljen egy aktív-aktív megoldást, mivel az aktív-passzív megoldás további késéssel jár.

Összetevők

Az aktív-passzív vészhelyreállítási megoldás számos Azure-szolgáltatást használ. Ez a példaarchitektúra a következő összetevőket foglalja magában:

Több fürt és régió: Több AKS-fürtöt helyez üzembe, amelyek mindegyike külön Azure-régióban található. A normál műveletek során a hálózati forgalom az Azure Front Door konfigurációjában beállított elsődleges AKS-fürthöz lesz irányítva.

Konfigurált fürtpriorizálás: Minden fürthöz 1–5 közötti rangsorolási szintet kell beállítania (1 a legmagasabb prioritás, az 5 pedig a legalacsonyabb prioritás). Több fürtöt is beállíthat ugyanarra a prioritási szintre, és megadhatja az egyes fürtök súlyát. Ha az elsődleges fürt elérhetetlenné válik, a forgalom automatikusan az Azure Front Doorban kiválasztott következő régióra irányítja. A rendszer működéséhez minden forgalomnak át kell haladnia az Azure Front Dooron.

Azure Front Door: Az Azure Front Door terheléselosztja és irányítja a forgalmat az elsődleges régió Azure-alkalmazás átjárópéldányához (a fürtöt 1. prioritással kell megjelölni). Régióhiba esetén a szolgáltatás átirányítja a forgalmat a prioritási listában szereplő következő fürtre.

További információ: Prioritásalapú forgalomirányítás.

Küllős pár: Minden regionális AKS-példányhoz központi küllős pár van üzembe helyezve. Az Azure Firewall Manager-szabályzatok az egyes régiókban kezelik a tűzfalszabályokat.

Key Vault: Minden régióban kiépítenie kell egy Azure Key Vaultot a titkos kulcsok és kulcsok tárolásához.

Log Analytics: A regionális Log Analytics-példányok regionális hálózati metrikákat és diagnosztikai naplókat tárolnak. A megosztott példányok az összes AKS-példány metrikáit és diagnosztikai naplóit tárolják.

Tárolóregisztrációs adatbázis: A számítási feladat tárolólemezképei egy felügyelt tárolóregisztrációs adatbázisban vannak tárolva. Ezzel a megoldással egyetlen Azure Container Registry-példányt használunk a fürt összes Kubernetes-példányához. Az Azure Container Registry georeplikálásával a rendszerképeket a kiválasztott Azure-régiókba replikálhatja, és folyamatos hozzáférést biztosít a képekhez még akkor is, ha egy régió leállást tapasztal.

Feladatátvételi folyamat

Ha egy szolgáltatás vagy szolgáltatásösszetevő elérhetetlenné válik egy régióban, a forgalmat egy olyan régióba kell irányítani, ahol a szolgáltatás elérhető. A többrégiós architektúra számos különböző hibapontot tartalmaz. Ebben a szakaszban a lehetséges hibapontokat mutatjuk be.

Alkalmazás podok (regionális)

A Kubernetes üzembehelyezési objektuma egy pod (ReplicaSet) több replikáját hozza létre. Ha az egyik nem érhető el, a forgalom a többi replika között lesz irányítva. A Kubernetes ReplicaSet megkísérli a megadott számú replika működését. Ha egy példány leáll, újra létre kell hozni egy új példányt. Az élőség-mintavételek ellenőrizhetik a podon futó alkalmazás vagy folyamat állapotát. Ha a pod nem válaszol, az élőség-mintavétel eltávolítja a podot, ami arra kényszeríti a ReplicaSetet , hogy hozzon létre egy új példányt.

További információ: Kubernetes ReplicaSet.

Alkalmazás podok (globális)

Amikor egy teljes régió elérhetetlenné válik, a fürt podjai már nem érhetők el a kérések kiszolgálására. Ebben az esetben az Azure Front Door-példány az összes forgalmat a többi állapotrégióba irányítja. Ezekben a régiókban a Kubernetes-fürtök és podok továbbra is kiszolgálják a kéréseket. A fennmaradó fürt felé irányuló megnövekedett forgalom és kérések kompenzálásához tartsa szem előtt az alábbi útmutatást:

  • Győződjön meg arról, hogy a hálózati és számítási erőforrások megfelelő méretűek ahhoz, hogy elnyeljék a régió feladatátvétele miatti hirtelen forgalomnövekedést. Az Azure Container Network Interface (CNI) használatakor például győződjön meg arról, hogy rendelkezik olyan alhálózattal, amely támogatja a kiugró forgalommal rendelkező pod IP-címeket.
  • A podreplikák számának növeléséhez használja a Vízszintes pod automatikus skálázót a megnövekedett regionális kereslet kompenzálásához.
  • Az AKS-fürt automatikus skálázási funkciójának használatával növelheti a Kubernetes-példány csomópontszámát a megnövekedett regionális kereslet kompenzálásához.

Kubernetes-csomópontkészletek (regionális)

Időnként előfordulhat, hogy honosított hiba történik a számítási erőforrásoknál, például az energia elérhetetlenné válik egyetlen Azure-kiszolgálói állványon. Ha meg szeretné védeni az AKS-csomópontokat attól, hogy egy pont regionális hiba legyen, használja az Azure Rendelkezésre állási zónákat. A rendelkezésre állási zónák biztosítják, hogy az egyes rendelkezésre állási zónák AKS-csomópontjai fizikailag elkülönüljenek a más rendelkezésre állási zónákban meghatározottaktól.

Kubernetes-csomópontkészletek (globális)

Teljes regionális hiba esetén az Azure Front Door a fennmaradó kifogástalan állapotú régiókba irányítja a forgalmat. Ügyeljen arra, hogy a fennmaradó fürt felé irányuló megnövekedett forgalmat és kéréseket kompenzálja.

Feladatátvételi tesztelési stratégia

Bár az AKS-ben jelenleg nem érhetők el mechanizmusok az üzembe helyezés teljes régiójának tesztelési célokra történő levételéhez, az Azure Chaos Studio lehetővé teszi, hogy káoszkísérletet hozzon létre a fürtön.

Következő lépések

Ha más megoldást fontolgat, tekintse meg az alábbi cikkeket: