Utiliser des clusters étendus locaux Azure pour la récupération d’urgence

Azure Local

Stockage Blob Azure

Sauvegarde Azure

Azure Monitor

L’architecture de référence suivante illustre la conception et l’implémentation de la récupération d’urgence d’Azure Local à l’aide d’un clustering étendu.

Architecture

Télécharger un fichier Visio de cette architecture.

Composants

L’architecture intègre les composants et fonctionnalités suivants :

Azure Stack HCI, version 22H2. local Azure est une solution de cluster d’infrastructure hyperconvergée (HCI) que vous pouvez utiliser pour héberger des charges de travail Windows et Linux virtualisées et leur stockage dans un environnement local hybride. Vous pouvez configurer le cluster étendu avec 4 à 16 nœuds physiques.
réplica de stockage. Le réplica de stockage est une technologie Windows Server qui permet la réplication de volume entre des serveurs ou des clusters à des fins de récupération d’urgence.
migration dynamique. La migration dynamique est une fonctionnalité Hyper-V dans Windows Server qui vous permet de déplacer en toute transparence des machines virtuelles en cours d’exécution d’un hôte Hyper-V vers un autre sans temps d’arrêt perçu.
témoin cloud. Le témoin cloud est un témoin de quorum de cluster de basculement qui utilise le Stockage Blob Microsoft Azure pour voter sur le quorum du cluster.

Détails du scénario

Vous utilisez généralement cette architecture pour la récupération d’urgence avec basculement automatique des machines virtuelles locales Azure et des partages de fichiers entre deux emplacements physiques dans une plage de 5 ms de latence réseau aller-retour.

Recommandations

La recommandation suivante s’applique à la plupart des scénarios. Suivez la recommandation, sauf si vous avez une exigence spécifique qui la remplace.

Utiliser des clusters étendus pour implémenter la récupération d’urgence automatisée pour les charges de travail virtualisées et les partages de fichiers hébergés sur Azure Local

Pour améliorer la résilience intégrée d’Azure Local, implémentez une instance locale Azure étendue qui se compose de deux groupes de nœuds, avec un groupe par site. Chaque groupe doit contenir un minimum de deux nœuds. Le nombre total de nœuds d’un cluster ne peut pas dépasser le nombre maximal de nœuds pris en charge par une instance locale Azure. Les nœuds doivent satisfaire à la configuration matérielle requise standard HCI.

Une instance locale Azure étendue s’appuie sur le réplica de stockage pour effectuer une réplication de stockage synchrone entre les volumes de stockage hébergés par les deux groupes de nœuds dans leurs sites physiques respectifs. Si une défaillance affecte la disponibilité du site principal, le cluster transfère automatiquement ses charges de travail vers des nœuds du site survivant afin de réduire les temps d’arrêt potentiels. Pour les temps d’arrêt planifiés ou prévus sur le site principal, vous pouvez utiliser Hyper-V Migration dynamique pour effectuer une transition transparente des charges de travail vers l’autre site, ce qui évite tout à fait les temps d’arrêt. Pour ce scénario, vous devez tenir compte de l’emplacement de stockage. Vous devez d’abord inverser la direction de réplication du réplica de stockage, puis effectuer la migration dynamique des machines virtuelles. L’impact sur les performances sera effectué jusqu’à la fin de la migration dynamique.

Note

La réplication synchrone garantit la cohérence des incidents avec zéro perte de données au niveau du système de fichiers pendant un basculement.

Prudence

L’exigence de réplication synchrone applicable aux clusters étendus impose une limite de 5 ms de latence réseau aller-retour entre deux groupes de nœuds de cluster dans les sites répliqués. Selon les caractéristiques de connectivité réseau physique, cette contrainte se traduit généralement en environ 20 à 30 miles physiques.

Note

La fonctionnalité de signature et de chiffrement du réplica de stockage protège automatiquement le trafic de réplication.

Considérations

Ces considérations implémentent les piliers d’Azure Well-Architected Framework, qui est un ensemble d’ensembles guidants qui peuvent être utilisés pour améliorer la qualité d’une charge de travail. Pour plus d’informations, consultez Microsoft Azure Well-Architected Framework.

Fiabilité

La fiabilité garantit que votre application peut respecter les engagements que vous prenez à vos clients. Pour plus d’informations, consultez liste de vérification de la révision de conception pour lede fiabilité.

Domaines d’erreur au niveau du site. Chaque site physique d’un cluster étendu local Azure représente des domaines d’erreur distincts qui fournissent une résilience supplémentaire. Un domaine d’erreur est un ensemble de composants matériels qui partagent un point de défaillance unique. Pour être tolérant aux pannes à un niveau particulier, vous avez besoin de plusieurs domaines d’erreur à ce niveau.

Note

Si chaque emplacement correspond à un site AD DS distinct, le processus d’approvisionnement de cluster configure automatiquement l’attribution de site. S’il n’existe aucun site AD DS distinct représentant les deux emplacements, mais que les nœuds se trouvent sur deux sous-réseaux différents, le processus d’approvisionnement de cluster identifie les sites en fonction des affectations de sous-réseaux. Si les nœuds se trouvent sur le même sous-réseau, vous devez définir explicitement l’attribution de site.

Prise en charge du site. La sensibilisation aux sites vous permet de contrôler l’emplacement des charges de travail virtualisées en désignant leurs sites préférés. La spécification du site préféré pour un cluster étendu offre de nombreux avantages, notamment la possibilité de regrouper des charges de travail au niveau du site et de personnaliser les options de vote de quorum. Par défaut, toutes les machines virtuelles utilisent le site préféré pendant un démarrage à froid, bien qu’il soit également possible de configurer le site préféré au niveau du rôle de cluster ou du groupe. Cela vous permet d’allouer des machines virtuelles spécifiques à leurs sites respectifs en mode actif/actif. Du point de vue du quorum, la sélection de site préférée affecte l’allocation des votes d’une manière qui favorise ce site. Par exemple, supposons que la connectivité entre les deux sites hébergeant des nœuds de cluster étendus échoue et que le témoin de cluster n’est pas accessible. Dans ce cas, le site préféré reste en ligne, tandis que les nœuds de l’autre site sont supprimés.
Amélioration de la vitesse de réparation des volumes directs des espaces de stockage. Les espaces de stockage direct fournissent une resynchronisation automatique des événements qui affectent la disponibilité des disques au sein de son pool de stockage, tels que l’arrêt d’un des nœuds de cluster ou d’une défaillance matérielle localisée. Azure Local implémente un processus de resynchronisation amélioré qui fonctionne à une granularité beaucoup plus fine que Windows Server 2019. Ce processus réduit considérablement la durée de l’opération de resynchronisation et réduit l’impact potentiel de plusieurs défaillances matérielles qui se chevauchent.
Limites de résilience. Azure Local fournit plusieurs niveaux de résilience, mais en raison de son architecture hyperconvergée, cette résilience est soumise à des limites imposées non seulement par le quorum de cluster , mais également par le quorum du pool .
Intégration à une gamme de services Azure qui offrent des avantages supplémentaires en matière de résilience. Vous pouvez intégrer des charges de travail virtualisées s’exécutant sur des instances locales Azure avec des services Azure tels que Sauvegarde Azure et Azure Site Recovery.
Basculement accéléré. Vous pouvez optimiser l’infrastructure réseau et sa configuration pour accélérer l’achèvement d’un basculement au niveau du site. Par exemple, vous pouvez tirer parti des réseaux locaux virtuels étendus (VLAN), des périphériques d’abstraction réseau et des valeurs de durée de vie (TTL) plus courtes dans les enregistrements DNS représentant des ressources en cluster. En outre, envisagez de réduire la période de résilience par défaut, qui détermine la période pendant laquelle une machine virtuelle en cluster est autorisée à s’exécuter dans l’état isolé.

Prudence

L’utilisation de clusters étendus avec SDN est considérée comme une configuration avancée et vous devez contacter votre intégrateur de systèmes ou le support Microsoft pour obtenir de l’aide supplémentaire.

Sécurité

La sécurité offre des garanties contre les attaques délibérées et l’abus de vos données et systèmes précieux. Pour plus d’informations, consultez liste de vérification de la révision de conception pour security.

Protection en transit. Le réplica de stockage offre une sécurité intégrée pour son trafic de réplication, notamment la signature de paquets, le chiffrement complet des données AES-128-GCM, la prise en charge de l’accélération du chiffrement Intel AES-NI et la prévention de l’intégrité de l’intégrité avant l’authentification. Le réplica de stockage utilise également Kerberos AES256 pour l’authentification entre les nœuds de réplication.
Chiffrement au repos. Azure Local prend en charge BitLocker Drive Encryption pour ses volumes de données, ce qui facilite la conformité avec les normes telles que FIPS 140-2 et HIPAA.
Intégration à un éventail de services Azure qui offrent des avantages de sécurité supplémentaires. Vous pouvez intégrer des charges de travail virtualisées s’exécutant sur des instances locales Azure avec des services Azure tels que Microsoft Defender pour Cloud
Configuration conviviale du pare-feu. Le trafic du réplica de stockage nécessite un nombre limité de ports ouverts entre les nœuds réplicants.

Prudence

Le réplica de stockage et les clusters étendus locaux Azure doivent fonctionner dans un environnement AD DS. Lors de la planification du déploiement de vos clusters étendus locaux Azure, assurez-vous de la connectivité aux contrôleurs de domaine AD DS dans chaque nœud de cluster d’hébergement de site.

Optimisation des coûts

L’optimisation des coûts consiste à examiner les moyens de réduire les dépenses inutiles et d’améliorer l’efficacité opérationnelle. Pour plus d’informations, consultez liste de vérification de la révision de conception pour l’optimisation des coûts.

Configuration active/active/passive. Les instances locales Azure étendues prennent en charge les modes actif-passif et actif-actif. En mode actif-passif, un site principal désigné est répliqué unidirectionnellement sur un autre site qui fournit la fonctionnalité de récupération d’urgence. En mode actif-actif, deux sites répliquent leurs volumes respectifs unidirectionnellement les uns vers les autres, fournissant une fonctionnalité de basculement en cas de défaillance dans l’un ou l’autre site. Le mode actif-actif permet de réduire les coûts de continuité d’activité en éliminant la nécessité d’un site de récupération d’urgence dédié.
Témoin cloud ou témoin de partage de fichiers. Une ressource témoin est un composant obligatoire dans les instances locales Azure. Pour l’implémenter, choisissez un témoin cloud Azure ou un témoin de partage de fichiers. Un témoin cloud Azure s’appuie sur un objet blob dans un compte de stockage Azure que vous désignez comme point d’arbitrage pour empêcher les scénarios fractionnés de cerveau. Un témoin de partage de fichiers s’appuie sur un partage de fichiers SMB (Server Message Block) pour atteindre le même objectif.

Note

Azure Cloud Witness est le choix recommandé pour les clusters étendus locaux Azure, à condition que tous les nœuds de serveur du cluster disposent de connexions Internet fiables. Les frais Azure correspondants sont négligeables ; elles sont basées sur le prix d’un petit objet blob avec des mises à jour peu fréquentes correspondant aux modifications apportées à l’état du cluster. Dans les scénarios impliquant des clusters étendus, un témoin de partage de fichiers doit résider dans un troisième site, ce qui peut augmenter considérablement les coûts d’implémentation, sauf si le troisième site est déjà disponible et dispose de connexions fiables existantes aux sites hébergeant les nœuds de cluster étendus.

Déduplication des données. Le réplica local et de stockage Azure prend en charge la déduplication des données. À compter de Windows Server 2019, la déduplication est disponible sur les volumes mis en forme avec le système de fichiers résilient (ReFS), qui est le système de fichiers recommandé pour Azure Local. La déduplication permet d’augmenter la capacité de stockage utilisable en identifiant les parties en double des fichiers et en les stockant une seule fois.

Prudence

Bien que vous deviez installer le service de rôle serveur de déduplication des données sur les serveurs source et de destination, n’activez pas la déduplication des données sur les nœuds de destination au sein d’un cluster étendu local Azure. Étant donné que la déduplication des données gère les écritures, elle doit s’exécuter uniquement sur les nœuds de cluster source. Les nœuds de destination reçoivent toujours des copies dédupliquées de chaque volume.

Excellence opérationnelle

L’excellence opérationnelle couvre les processus d’exploitation qui déploient une application et la conservent en production. Pour plus d’informations, consultez liste de vérification de la révision de conception pour l’excellence opérationnelle.

Basculement et récupération automatiques. Un échec de site principal déclenche un basculement automatique. Après le basculement, le processus d’établissement de la réplication à partir du nouveau site secondaire/ancien vers le nouveau site principal/ancien est automatique. Pour éviter toute perte de données potentielle, le cluster empêche la restauration automatique jusqu’à ce que les volumes répliqués soient entièrement synchronisés.
Expérience simplifiée d’approvisionnement et de gestion à l’aide de Windows Admin Center. L’Assistant Création d’un cluster dans Windows Admin Center fournit une interface pilotée par l’Assistant qui vous guide tout au long du processus de création d’un cluster étendu local Azure. L’Assistant détecte si les nœuds de cluster résident dans deux sites Ad DS (Active Directory Domain Services) distincts ou si leurs adresses IP appartiennent à deux sous-réseaux différents. S’ils résident dans deux sous-réseaux différents, l’Assistant crée et configure automatiquement les sites de cluster correspondants, chacun représentant un domaine d’erreur distinct. Il vous permet également de désigner le site préféré. De même, Windows Admin Center simplifie le processus d’approvisionnement des volumes répliqués.

Note

La création de volumes et de disques virtuels pour des clusters étendus est plus impliquée que pour les clusters à site unique. Les clusters étendus nécessitent un minimum de quatre volumes, composés de deux volumes de données et de deux volumes de journaux, avec une paire de volumes de données/journal sur chaque site. Lorsque vous créez un volume de données répliqué à l’aide de Windows Admin Center, le processus provisionne automatiquement le volume de journal dans le site principal et les volumes répliqués de données et de journaux dans le site secondaire, ce qui garantit que chacun d’eux a la taille et les paramètres de configuration requis.

Prise en charge de provisionnement de cluster étendu automatisé et gestion du stockage à l’aide de Windows PowerShell. Vous pouvez exécuter PowerShell localement à partir de l’une des machines locales Azure ou à distance à partir d’un ordinateur de gestion.
Intégration à une gamme de services Azure qui offrent des avantages opérationnels supplémentaires. Vous pouvez intégrer des charges de travail virtualisées s’exécutant sur des instances locales Azure avec des services Azure tels que des solutions Azure Monitor et Azure Automation, notamment Change Tracking and Inventory et Update Management. À la suite d’une procédure d’inscription obligatoire initiale, les instances locales Azure peuvent tirer parti d’Azure Arc pour la supervision et la facturation. L’intégration d’Azure Arc offre une intégration améliorée avec d’autres services hybrides, tels que Azure Policy et log Analytics. L’inscription déclenche la création d’une ressource Azure Resource Manager représentant une instance locale Azure, étendant efficacement le plan de gestion Azure à Azure Local.

Efficacité des performances

L’efficacité des performances est la capacité de votre charge de travail à répondre aux demandes qu’elle impose aux utilisateurs de manière efficace. Pour plus d’informations, consultez liste de vérification de la révision de conception pour l’efficacité des performances.

Trafic de réplication optimisé. Lors de la conception d’une infrastructure pour les clusters étendus locaux Azure, envisagez un réplica de stockage supplémentaire, une migration dynamique et le trafic d’historique des performances du cluster de réplica de stockage entre les sites. La réplication synchrone nécessite au moins 1 Go d’accès direct à distance (RDMA) ou une connexion Ethernet/TCP entre des sites de cluster étendus. Toutefois, en fonction du volume du trafic de réplication, vous devrez peut-être disposer d’un connexion RDMA plus rapide. Vous devez également provisionner plusieurs connexions entre les sites, ce qui offre des avantages de résilience et vous permet d'trafic de réplica de stockage distinct de Hyper-V trafic de migration dynamique.

Prudence

RDMA est activé par défaut pour tout le trafic entre les nœuds de cluster du même site sur le même sous-réseau. RDMA est désactivé et non pris en charge entre les sites ou entre différents sous-réseaux. Vous devez désactiver SMB Direct pour le trafic intersites ou implémenter dispositions supplémentaires qui le séparent du trafic entre nœuds au sein du même site.

prise en charge de la synchronisation initiale amorçage. Vous pouvez implémenter des de synchronisation initiales amorçage dans les scénarios où le temps de synchronisation initial doit être réduit ou lorsqu’il existe une bande passante limitée disponible entre les deux sites hébergeant le cluster étendu.
Traitement optimisé des E/S de stockage. Assurez-vous configuration optimale des volumes de données et de journaux répliqués, y compris leur niveau de performances, le dimensionnement du volume et le secteur, le type de disque et le système de fichiers.

Note

Windows Admin Center affecte automatiquement la configuration optimale si vous l’utilisez pour provisionnement de volumes de cluster étendus.

Étapes suivantes

vue d’ensemble de la solution locale Azure
clustering de basculement dans Windows Server et Azure Local
déployer un témoin cloud pour un de cluster de basculement
Nouveautés d’Azure Local
FAQ sur Azure Local

conception d’architecture hybride
options hybrides Azure
Utiliser l’interconnexion sans commutateur local Azure et le quorum léger pour les bureau distant ou de succursale
Optimiser l’administration des instances SQL Server dans des environnements locaux et multiclouds à l’aide d’Azure Arc
Azure Automation State Configuration

Partager via

Utiliser des clusters étendus locaux Azure pour la récupération d’urgence

Architecture

Composants

Détails du scénario

Recommandations

Utiliser des clusters étendus pour implémenter la récupération d’urgence automatisée pour les charges de travail virtualisées et les partages de fichiers hébergés sur Azure Local

Considérations

Fiabilité

Sécurité

Optimisation des coûts

Excellence opérationnelle

Efficacité des performances

Étapes suivantes

Commentaires

Ressources supplémentaires

Partager via

Utiliser des clusters étendus locaux Azure pour la récupération d’urgence

Architecture

Composants

Détails du scénario

Recommandations

Utiliser des clusters étendus pour implémenter la récupération d’urgence automatisée pour les charges de travail virtualisées et les partages de fichiers hébergés sur Azure Local

Considérations

Fiabilité

Sécurité

Optimisation des coûts

Excellence opérationnelle

Efficacité des performances

Étapes suivantes

Ressources associées

Commentaires

Ressources supplémentaires