Megosztás a következőn keresztül:


Az Azure Kubernetes Service (AKS) csomópont automatikus javítása

Az Azure Kubernetes Service (AKS) folyamatosan figyeli a munkavégző csomópontok állapotát, és automatikus csomópont-javítást végez, ha nem kifogástalan állapotba kerülnek. Az Azure-beli virtuálisgép-platform karbantartást végez a problémákat tapasztaló virtuális gépeken . Az AKS és az Azure-beli virtuális gépek együtt minimalizálják a fürtök szolgáltatáskimaradásait.

Ebből a cikkből megtudhatja, hogyan működik az automatikus csomópont-javítási funkció a Windows- és Linux-csomópontok esetében.

Hogyan ellenőrzi az AKS a NotReady-csomópontokat?

Az AKS a következő szabályokkal állapítja meg, hogy egy csomópont nem megfelelő-e, és javításra van szükség:

A parancs segítségével kubectl get nodes manuálisan ellenőrizheti a csomópontok állapotát.

Az automatikus javítás működése

Feljegyzés

Az AKS az aks-remediator felhasználói fiókkal kezdeményezi a javítási műveleteket.

Ha az AKS egy legalább öt percig nem kifogástalan állapotú csomópontot azonosít, az AKS a következő műveleteket hajtja végre:

  1. Az AKS újraindítja a csomópontot.
  2. Ha a csomópont az újraindítás után nem megfelelő állapotban marad, az AKS újra megkonimálja a csomópontot.
  3. Ha a csomópont az újraimálás után nem megfelelő állapotban marad, és linuxos csomópont, az AKS újra üzembe helyezi a csomópontot.

Az AKS legfeljebb háromszor újrapróbálja az újraindítási, újraimázsi és ismételt üzembe helyezési sorozatot, ha a csomópont állapota nem megfelelő. Az automatikus javítás teljes folyamata akár egy órát is igénybe vehet.

Korlátozások

Az AKS-csomópont automatikus javítása a legjobb munkamennyiség-szolgáltatás, és nem garantáljuk, hogy a csomópont kifogástalan állapotba kerül. Ha a csomópont nem kifogástalan állapotban marad, javasoljuk, hogy végezze el a csomópont manuális vizsgálatát. További információ a csomópont NotReady állapotának hibaelhárításáról.

Vannak olyan esetek, amikor az AKS nem végez automatikus javítást. A csomópont automatikus javítása sikertelen lehet akár a tervezés, akár ha az Azure nem észleli a probléma meglétét. Példák arra, ha az automatikus javítás nem történik meg:

  • A hálózati konfiguráció hibája miatt a csomópont állapota nem jelenik meg.
  • Egy csomópont kezdetben nem tudott kifogástalan állapotú csomópontként regisztrálni.
  • Ha a csomóponton a következő fertőzöttek egyike található: node.cloudprovider.kubernetes.io/shutdown, ToBeDeletedByClusterAutoscaler.

Csomópont automatikus javításának figyelése Kubernetes-eseményekkel

Amikor az AKS elvégzi a csomópontok automatikus javítását a fürtön, az AKS kubernetes-eseményeket bocsát ki az aks-auto-repair forrásból a láthatóság érdekében. Az automatikus javítás során a következő események jelennek meg egy csomópontobjektumon.

Ha többet szeretne megtudni a Kubernetes-események riasztásainak eléréséről, tárolásáról és konfigurálásáról, olvassa el a Kubernetes-események használata hibaelhárításhoz az Azure Kubernetes Service-ben című témakört.

Ok Eseményüzenet Leírás
NodeRebootStart A csomópont automatikus javítása újraindítási műveletet kezdeményez, mivel a NotReady állapota több mint 5 percig fennáll. Ez az esemény értesítést küld, ha az újraindítás a csomóponton történik. Ez a művelet az első a csomópont automatikus javítási sorozatában.
NodeRebootEnd A csomópont automatikus javításának újraindítási művelete befejeződött. Kibocsátva, ha az újraindítás befejeződött a csomóponton. Ez az esemény nem jelzi a csomópont állapotát (kifogástalan vagy nem megfelelő) az újraindítás után.
NodeReimageStart A csomópont automatikus javítása újraimálási műveletet kezdeményez, mivel a NotReady állapota több mint 5 percig fennáll. Ez az esemény értesítést küld, ha a csomóponton újraimálásra készül.
NodeReimageEnd A csomópont automatikus javításának újraimálási művelete befejeződött. A kibocsátva, ha az újraimázs befejeződött a csomóponton. Ez az esemény nem jelzi a csomópont állapotát (kifogástalan vagy nem megfelelő) az újraimálás végrehajtása után.
NodeRedeployStart A csomópont automatikus javítása újratelepítési műveletet kezdeményez, mivel a NotReady állapota több mint 5 percig tart. Ez az esemény értesítést küld, ha a csomóponton újra üzembe helyezésre készül. Az újbóli üzembe helyezés a csomópont automatikus javítási sorozatának utolsó művelete.
NodeRedeployEnd A csomópont automatikus javításával végzett ismételt üzembe helyezési művelet befejeződött. A kibocsátva, ha az ismételt üzembe helyezés befejeződött a csomóponton. Ez az esemény nem jelzi a csomópont állapotát (kifogástalan vagy nem megfelelő) az újbóli üzembe helyezés után.

Ha a csomópont automatikus javítási folyamata során hibák lépnek fel, a rendszer a következő eseményeket adja ki a szó szerinti hibaüzenettel. További információ a csomópontok automatikus javításával kapcsolatos gyakori hibák elhárításáról.

Feljegyzés

Az alábbi eseményüzenetek hibakódja a jelentett hibától függően változik.

Ok Eseményüzenet Leírás
NodeRebootError A csomópont automatikus javítási újraindítási művelete művelethiba miatt meghiúsult. A hiba részletei itt láthatók: Hibakód Az újraindítási művelettel kapcsolatos hibaüzenet jelenik meg.
NodeReimageError A csomópont automatikus javítása művelethiba miatt meghiúsult. A hiba részletei itt láthatók: Hibakód A rendszer kibocsátja, ha hiba történt az újraimázslási művelettel kapcsolatban.
NodeRedeployError A csomópont automatikus javítási újratelepítési művelete művelethiba miatt meghiúsult. A hiba részletei itt láthatók: Hibakód Az ismételt üzembe helyezési művelettel kapcsolatos hiba esetén kibocsátva.

Következő lépések

Alapértelmezés szerint az elmúlt 1 órától elérheti a Kubernetes-eseményeket és -naplókat az AKS-fürtön. Az elmúlt 90 nap eseményeinek és naplóinak tárolásához és lekérdezéséhez engedélyezze a Container Insightst az AKS-fürt mélyebb hibaelhárításához.