gebeurtenis
17 mrt, 21 - 21 mrt, 10
Neem deel aan de meetup-serie om schaalbare AI-oplossingen te bouwen op basis van praktijkgebruiksvoorbeelden met collega-ontwikkelaars en experts.
Nu registrerenDeze browser wordt niet meer ondersteund.
Upgrade naar Microsoft Edge om te profiteren van de nieuwste functies, beveiligingsupdates en technische ondersteuning.
In dit artikel vindt u een overzicht van het gebruik van de Vertical Pod Autoscaler (VPA) in Azure Kubernetes Service (AKS), die is gebaseerd op de open source Kubernetes-versie .
Wanneer de VPA is geconfigureerd, worden resourceaanvragen en limieten voor containers per workload automatisch ingesteld op basis van het eerdere gebruik. De VPA maakt CPU en geheugen vrij voor andere pods en zorgt voor effectief gebruik van uw AKS-clusters. De verticale automatische schaalaanpassing van pods biedt aanbevelingen voor resourcegebruik gedurende een bepaalde periode. Als u plotselinge toenamen in resourcegebruik wilt beheren, gebruikt u de horizontale automatische schaalaanpassing van pods, waarmee het aantal podreplica's naar behoefte wordt geschaald.
De verticale automatische schaalaanpassing van pods biedt de volgende voordelen:
Houd rekening met de volgende beperkingen en overwegingen bij het gebruik van de automatische schaalaanpassing van verticale pods:
VerticalPodAutoscaler
objecten per cluster.VerticalPodAutoscaler
object. De VPA kan een probleem met onvoldoende knooppuntresources niet volledig oplossen. Het limietbereik is vast, maar het resourcegebruik van het knooppunt wordt dynamisch gewijzigd.Het VPA-object bestaat uit drie onderdelen:
De VPA-toegangscontroller is een binair bestand dat zich registreert als een Mutating Admission Webhook. Wanneer er een nieuwe pod wordt gemaakt, ontvangt de VPA-toegangscontroller een aanvraag van de API-server en wordt geëvalueerd of er een overeenkomende VPA-configuratie is of een bijbehorende wordt gevonden en wordt de huidige aanbeveling gebruikt om resourceaanvragen in te stellen in de pod.
Een zelfstandige taak, overlay-vpa-cert-webhook-check
wordt buiten de VPA-toegangscontroller uitgevoerd. De overlay-vpa-cert-webhook-check
taak maakt en vernieuwt de certificaten en registreert de VPA-toegangscontroller als een MutatingWebhookConfiguration
.
Een resource voor automatische schaalaanpassing van verticale pods, meestal een implementatie, wordt ingevoegd voor elke controller waarvoor automatisch resourcevereisten moeten worden berekend.
Er zijn vier modi waarin de VPA werkt:
Auto
: VPA wijst resourceaanvragen toe tijdens het maken van pods en werkt bestaande pods bij met behulp van het aanbevolen updatemechanisme. Auto
, wat gelijk is aan Recreate
, is de standaardmodus. Zodra er updates van podaanvragen beschikbaar zijn die gratis opnieuw worden opgestart of in-place zijn, kan deze worden gebruikt als het voorkeursupdatemechanisme door de Auto
modus. Met de Auto
modus verwijdert VPA een pod als deze de resourceaanvragen moet wijzigen. Dit kan ertoe leiden dat de pods allemaal tegelijk opnieuw worden opgestart, wat kan leiden tot inconsistenties van de toepassing. U kunt herstarts beperken en consistentie in deze situatie behouden met behulp van een PodDisruptionBudget.Recreate
: VPA wijst resourceaanvragen toe tijdens het maken van pods en werkt bestaande pods bij door ze te verwijderen wanneer de aangevraagde resources aanzienlijk verschillen van de nieuwe aanbevelingen (met inachtneming van podDisruptionBudget, indien gedefinieerd). U moet deze modus alleen gebruiken als u ervoor moet zorgen dat de pods opnieuw worden opgestart wanneer de resourceaanvraag wordt gewijzigd. Anders raden we u aan de modus te gebruiken Auto
, die profiteert van updates zonder opnieuw opstarten zodra deze beschikbaar zijn.Initial
: VPA wijst alleen resourceaanvragen toe tijdens het maken van de pod. Bestaande pods worden niet bijgewerkt. Deze modus is handig voor het testen en begrijpen van het VPA-gedrag zonder dat dit van invloed is op de actieve pods.Off
: VPA wijzigt niet automatisch de resourcevereisten van de pods. De aanbevelingen worden berekend en kunnen worden geïnspecteerd in het VPA-object.Als u niet bekend bent met VPA, raden we het volgende implementatiepatroon aan tijdens het ontwikkelen van toepassingen om de unieke kenmerken van het resourcegebruik te identificeren, VPA te testen om te controleren of deze goed werkt en naast andere Kubernetes-onderdelen te testen om het resourcegebruik van het cluster te optimaliseren:
UpdateMode = "Off"
in uw productiecluster in en voer VPA uit in de aanbevelingsmodus, zodat u VPA kunt testen en vertrouwd kunt raken met VPA. UpdateMode = "Off"
kan voorkomen dat er een onjuiste configuratie wordt ingevoerd die een storing kan veroorzaken.updateMode
de waarde in op Auto
, Recreate
of Initial
afhankelijk van uw vereisten.Azure Kubernetes Service-feedback
Azure Kubernetes Service is een open source project. Selecteer een koppeling om feedback te geven:
gebeurtenis
17 mrt, 21 - 21 mrt, 10
Neem deel aan de meetup-serie om schaalbare AI-oplossingen te bouwen op basis van praktijkgebruiksvoorbeelden met collega-ontwikkelaars en experts.
Nu registreren