Az Azure Kubernetes Service (AKS) csomópont automatikus javítása
Az Azure Kubernetes Service (AKS) folyamatosan figyeli a munkavégző csomópontok állapotát, és automatikus csomópont-javítást végez, ha nem kifogástalan állapotba kerülnek. Az Azure-beli virtuálisgép-platform karbantartást végez a problémákat tapasztaló virtuális gépeken . Az AKS és az Azure-beli virtuális gépek együtt minimalizálják a fürtök szolgáltatáskimaradásait.
Ebből a cikkből megtudhatja, hogyan működik az automatikus csomópont-javítási funkció a Windows- és Linux-csomópontok esetében.
Hogyan ellenőrzi az AKS a NotReady-csomópontokat?
Az AKS a következő szabályokkal állapítja meg, hogy egy csomópont nem megfelelő-e, és javításra van szükség:
- A csomópont 10 perces időkereten belül jelenti az egymást követő ellenőrzések NotReady-állapotát.
- A csomópont 10 percen belül nem jelent állapotot.
A parancs segítségével kubectl get nodes
manuálisan ellenőrizheti a csomópontok állapotát.
Az automatikus javítás működése
Feljegyzés
Az AKS az aks-remediator felhasználói fiókkal kezdeményezi a javítási műveleteket.
Ha az AKS egy legalább öt percig nem kifogástalan állapotú csomópontot azonosít, az AKS a következő műveleteket hajtja végre:
- Az AKS újraindítja a csomópontot.
- Ha a csomópont az újraindítás után nem megfelelő állapotban marad, az AKS újra megkonimálja a csomópontot.
- Ha a csomópont az újraimálás után nem megfelelő állapotban marad, és linuxos csomópont, az AKS újra üzembe helyezi a csomópontot.
Az AKS legfeljebb háromszor újrapróbálja az újraindítási, újraimázsi és ismételt üzembe helyezési sorozatot, ha a csomópont állapota nem megfelelő. Az automatikus javítás teljes folyamata akár egy órát is igénybe vehet.
Korlátozások
Az AKS-csomópont automatikus javítása a legjobb munkamennyiség-szolgáltatás, és nem garantáljuk, hogy a csomópont kifogástalan állapotba kerül. Ha a csomópont nem kifogástalan állapotban marad, javasoljuk, hogy végezze el a csomópont manuális vizsgálatát. További információ a csomópont NotReady állapotának hibaelhárításáról.
Vannak olyan esetek, amikor az AKS nem végez automatikus javítást. A csomópont automatikus javítása sikertelen lehet akár a tervezés, akár ha az Azure nem észleli a probléma meglétét. Példák arra, ha az automatikus javítás nem történik meg:
- A hálózati konfiguráció hibája miatt a csomópont állapota nem jelenik meg.
- Egy csomópont kezdetben nem tudott kifogástalan állapotú csomópontként regisztrálni.
- Ha a csomóponton a következő fertőzöttek egyike található:
node.cloudprovider.kubernetes.io/shutdown
,ToBeDeletedByClusterAutoscaler
.
Csomópont automatikus javításának figyelése Kubernetes-eseményekkel
Amikor az AKS elvégzi a csomópontok automatikus javítását a fürtön, az AKS kubernetes-eseményeket bocsát ki az aks-auto-repair forrásból a láthatóság érdekében. Az automatikus javítás során a következő események jelennek meg egy csomópontobjektumon.
Ha többet szeretne megtudni a Kubernetes-események riasztásainak eléréséről, tárolásáról és konfigurálásáról, olvassa el a Kubernetes-események használata hibaelhárításhoz az Azure Kubernetes Service-ben című témakört.
Ok | Eseményüzenet | Leírás |
---|---|---|
NodeRebootStart | A csomópont automatikus javítása újraindítási műveletet kezdeményez, mivel a NotReady állapota több mint 5 percig fennáll. | Ez az esemény értesítést küld, ha az újraindítás a csomóponton történik. Ez a művelet az első a csomópont automatikus javítási sorozatában. |
NodeRebootEnd | A csomópont automatikus javításának újraindítási művelete befejeződött. | Kibocsátva, ha az újraindítás befejeződött a csomóponton. Ez az esemény nem jelzi a csomópont állapotát (kifogástalan vagy nem megfelelő) az újraindítás után. |
NodeReimageStart | A csomópont automatikus javítása újraimálási műveletet kezdeményez, mivel a NotReady állapota több mint 5 percig fennáll. | Ez az esemény értesítést küld, ha a csomóponton újraimálásra készül. |
NodeReimageEnd | A csomópont automatikus javításának újraimálási művelete befejeződött. | A kibocsátva, ha az újraimázs befejeződött a csomóponton. Ez az esemény nem jelzi a csomópont állapotát (kifogástalan vagy nem megfelelő) az újraimálás végrehajtása után. |
NodeRedeployStart | A csomópont automatikus javítása újratelepítési műveletet kezdeményez, mivel a NotReady állapota több mint 5 percig tart. | Ez az esemény értesítést küld, ha a csomóponton újra üzembe helyezésre készül. Az újbóli üzembe helyezés a csomópont automatikus javítási sorozatának utolsó művelete. |
NodeRedeployEnd | A csomópont automatikus javításával végzett ismételt üzembe helyezési művelet befejeződött. | A kibocsátva, ha az ismételt üzembe helyezés befejeződött a csomóponton. Ez az esemény nem jelzi a csomópont állapotát (kifogástalan vagy nem megfelelő) az újbóli üzembe helyezés után. |
Ha a csomópont automatikus javítási folyamata során hibák lépnek fel, a rendszer a következő eseményeket adja ki a szó szerinti hibaüzenettel. További információ a csomópontok automatikus javításával kapcsolatos gyakori hibák elhárításáról.
Feljegyzés
Az alábbi eseményüzenetek hibakódja a jelentett hibától függően változik.
Ok | Eseményüzenet | Leírás |
---|---|---|
NodeRebootError | A csomópont automatikus javítási újraindítási művelete művelethiba miatt meghiúsult. A hiba részletei itt láthatók: Hibakód | Az újraindítási művelettel kapcsolatos hibaüzenet jelenik meg. |
NodeReimageError | A csomópont automatikus javítása művelethiba miatt meghiúsult. A hiba részletei itt láthatók: Hibakód | A rendszer kibocsátja, ha hiba történt az újraimázslási művelettel kapcsolatban. |
NodeRedeployError | A csomópont automatikus javítási újratelepítési művelete művelethiba miatt meghiúsult. A hiba részletei itt láthatók: Hibakód | Az ismételt üzembe helyezési művelettel kapcsolatos hiba esetén kibocsátva. |
Következő lépések
Alapértelmezés szerint az elmúlt 1 órától elérheti a Kubernetes-eseményeket és -naplókat az AKS-fürtön. Az elmúlt 90 nap eseményeinek és naplóinak tárolásához és lekérdezéséhez engedélyezze a Container Insightst az AKS-fürt mélyebb hibaelhárításához.
Azure Kubernetes Service