Procedury konserwacji klastra przełączania awaryjnego

Artykuł
03/09/2025

Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Ważne

Usługa Azure Stack HCI jest teraz częścią usługi Azure Local. Jednak starsze wersje rozwiązania Azure Stack HCI, na przykład 22H2 będą nadal odwoływać się do rozwiązania Azure Stack HCI i nie będą odzwierciedlać zmiany nazwy. Dowiedz się więcej.

W tym artykule założono, że konieczne jest wyłączenie serwera fizycznego w celu przeprowadzenia konserwacji lub ponowne uruchomienie go z jakiegoś powodu. Aby zainstalować aktualizacje w klastrze usługi Azure Stack HCI bez przełączeń serwerów w tryb offline, zobacz Aktualizowanie klastrów rozwiązania Azure Stack HCI.

Wyłączenie serwera w celu konserwacji wymaga wyłączenia części magazynu, które są współużytkowane przez wszystkie serwery w klastrze awaryjnym. Wymaga to wstrzymania serwera, który ma zostać przełączony w tryb offline, umieszczenie dysków serwera w trybie konserwacji, przeniesienie ról klastrowanych i maszyn wirtualnych do innych serwerów w klastrze oraz sprawdzenie, czy wszystkie dane są dostępne na innych serwerach w klastrze. Ten proces gwarantuje, że dane pozostają bezpieczne i dostępne przez cały okres konserwacji.

Możesz użyć centrum administracyjnego systemu Windows lub programu PowerShell, aby przejąć serwer w tryb offline na potrzeby konserwacji. W tym temacie omówiono obie metody.

Przełącz serwer w tryb offline przy użyciu centrum administracyjnego systemu Windows

Najprostszym sposobem przygotowania do przełączenie serwera w tryb offline jest użycie centrum administracyjnego systemu Windows.

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Za pomocą programu Windows Admin Center nawiąż połączenie z serwerem, który chcesz przełączyć w tryb offline. Wybierz Dyski pamięci z menu Narzędzia, i sprawdź, czy w kolumnie Stan dla każdego dysku wirtualnego jest wyświetlana wartość Online.
Następnie wybierz pozycję > magazynu i sprawdź, czy kolumna Kondycja dla każdego woluminu ma wartość W dobrej kondycji i czy kolumna Stan dla każdego woluminu jest wyświetlana ok.

Wstrzymywanie i opróżnianie serwera

Przed zamknięciem lub ponownym uruchomieniem serwera należy wstrzymać serwer i opróżnić (przenieść) wszystkie role klastrowane, takie jak maszyny wirtualne uruchomione na nim. Zawsze wstrzymuj i opróżniaj klastrowane serwery przed przełączeniem ich w tryb offline w celu przeprowadzenia konserwacji.

Za pomocą programu Windows Admin Center połącz się z klastrem, a następnie wybierz pozycję > obliczeniowe z menu Narzędzia w Menedżerze klastra.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wstrzymać i opróżnić, a następnie wybierz pozycję Wstrzymaj. Powinien zostać wyświetlony następujący monit:

Wstrzymaj serwery na potrzeby konserwacji: Czy na pewno chcesz wstrzymać serwery? Spowoduje to przeniesienie obciążeń, takich jak maszyny wirtualne, do innych serwerów w klastrze.
Wybierz pozycję Tak , aby wstrzymać serwer i zainicjować proces opróżniania. Stan serwera będzie wyświetlany jako W konserwacji, przenoszenie zadań, a role, takie jak Hyper-V i maszyny wirtualne, natychmiast rozpoczną migrację na żywo do innych serwerów w klastrze. Może to potrwać kilka minut. Do momentu wznowienia nie można dodać ról do serwera. Po zakończeniu procesu opróżniania stan serwera będzie wyświetlany jako W konserwacji, Opróżnianie ukończone. System operacyjny przeprowadza automatyczną kontrolę bezpieczeństwa, aby upewnić się, że jest bezpieczny do kontynuowania. Jeśli istnieją niezdrowe woluminy, to zatrzyma się i ostrzeże Cię, że nie jest bezpiecznie kontynuować.

Zamykanie serwera

Po zakończeniu opróżniania serwera można bezpiecznie zamknąć go w celu konserwacji lub ponownego uruchomienia.

Ostrzeżenie

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, przed zamknięciem serwera należy umieścić dyski w trybie konserwacji i wycofać dyski z trybu konserwacji przed wznowieniem serwera w klastrze.

Wznawianie działania serwera

Gdy serwer będzie gotowy do ponownego rozpoczęcia hostowania ról klastrowanych i maszyn wirtualnych, po prostu włącz serwer, zaczekaj na jego uruchomienie i wznów działanie serwera, wykonując następujące kroki.

W Menedżerze klastra wybierz pozycję > obliczeniowe z menu Narzędzia po lewej stronie.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wznowić, a następnie kliknij przycisk Wznów.

Role klastrowane i maszyny wirtualne natychmiast rozpoczną migrację na żywo z powrotem do serwera. Może to potrwać kilka minut.

Poczekaj na ponowną synchronizację pamięci

Po wznowieniu działania serwera wszystkie nowe zapisy, które wystąpiły, gdy był niedostępny, muszą zostać ponownie zsynchronizowane. Dzieje się to automatycznie przy użyciu inteligentnego śledzenia zmian. Nie jest to konieczne, aby wszystkie dane zostały przeskanowane ani zsynchronizowane; tylko zmiany. Ten proces jest ograniczany w celu ograniczenia wpływu na obciążenia produkcyjne. W zależności od czasu wstrzymania serwera i ilości zapisanych nowych danych może upłynąć wiele minut.

Ważne

Przed przełączenie innych serwerów w klastrze w tryb offline należy poczekać na ukończenie ponownej synchronizacji.

Aby sprawdzić, czy ponowna synchronizacja magazynu została ukończona:

Połącz się z klastrem przy użyciu Centrum administracyjnego systemu Windows i wybierz Magazyn > Woluminy.
Wybierz Zapasy.
Sprawdź kolumnę Stan dla każdego woluminu. Jeśli wyświetli się OK, synchronizacja magazynu została zakończona. Teraz można bezpiecznie wyłączyć inne serwery w klastrze.

Przełącz serwer w tryb offline przy użyciu programu PowerShell

Użyj poniższych procedur, aby prawidłowo wstrzymać, opróżnić i wznowić serwer w klastrze trybu failover przy użyciu programu PowerShell.

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Aby sprawdzić, czy wszystkie woluminy są w dobrej kondycji, uruchom następujące polecenie cmdlet jako administrator:

Get-VirtualDisk

Oto przykład tego, jak mogą wyglądać dane wyjściowe:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Sprawdź, czy właściwość HealthStatus dla każdego woluminu jest w dobrej kondycji, a wartość OperationalStatus pokazuje ok.

Aby to zrobić przy użyciu Menedżera klastra failover, przejdź do Magazyn>Dyski.

Wstrzymywanie i opróżnianie serwera

Uruchom następujące polecenie cmdlet jako administrator, aby wstrzymać i opróżnić serwer:

Suspend-ClusterNode -Drain

Aby to zrobić w Menedżerze klastra trybu failover, przejdź do Węzły, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz Wstrzymaj>Opróżnij role.

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, wstrzymanie i opróżnienie serwera spowoduje również przełączenie dysków serwera w tryb konserwacji. Jeśli na serwerze działa rozwiązanie Azure Stack HCI w wersji 20H2, Windows Server 2019 lub Windows Server 2016, musisz to zrobić ręcznie (zobacz następny krok).

Wprowadź dyski w tryb konserwacji

W usłudze Azure Stack HCI w wersji 20H2, Windows Server 2019 i Windows Server 2016, umieszczenie dysków serwera w trybie konserwacji daje Storage Spaces Direct możliwość spokojnego opróżniania i zatwierdzania danych, aby zapewnić, że zamknięcie serwera nie wpływa na stan aplikacji. Gdy tylko dysk przejdzie do trybu konserwacji, nie będzie już zezwalać na zapisy. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy umieszczenie dysków w tryb konserwacji bezpośrednio przed ponownym uruchomieniem i wyprowadzenie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.

Uwaga

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski są automatycznie umieszczane w trybie konserwacji po wstrzymaniu i opróżnieniu serwera. Te systemy operacyjne mają szczegółową funkcję naprawy, która sprawia, że ponowne synchronizowanie jest szybsze i mniej wpływające na zasoby systemowe i sieciowe, dzięki czemu można wykonać konserwację serwera i magazynu razem.

Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Zamykanie serwera

Po zakończeniu opróżniania serwera będzie on wyświetlany jako Wstrzymany w programie PowerShell i Menedżerze klastra trybu failover.

Teraz można bezpiecznie zamknąć serwer lub uruchomić go ponownie za pomocą Stop-Computer poleceń cmdlet programu PowerShell lub Restart-Computer przy użyciu Menedżera klastra trybu failover.

Uwaga

W przypadku uruchamiania polecenia Get-VirtualDisk na serwerach, na których następuje zamykanie lub uruchamianie/zatrzymywanie usługi klastra, status operacyjny serwera może być zgłaszany jako niekompletny lub pogorszony, a kolumna Stan zdrowia może zawierać ostrzeżenie. Jest to normalne i nie powinno powodować niepokoju. Wszystkie woluminy pozostają w trybie online i są dostępne.

Wyjmij dyski z trybu konserwacji

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, należy wyłączyć tryb konserwacji magazynu na dyskach przed wznowieniem serwera w klastrze. Aby zminimalizować czas ponownej synchronizacji pamięci, zalecamy wyjęcie ich z trybu konserwacji, gdy tylko system zacznie znowu działać.

Uwaga

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski zostaną automatycznie wyjęte z trybu konserwacji po wznowieniu serwera.

Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator, aby wyłączyć tryb konserwacji pamięci masowej.

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Wznawianie działania serwera

Wznów serwer w klastrze. Aby zwrócić role klastrowane i maszyny wirtualne, które były wcześniej uruchomione na serwerze, użyj opcjonalnej flagi -Failback :

Resume-ClusterNode –Failback Immediate

Aby to zrobić w Menedżerze klastra awaryjnego, przejdź do Węzły, prawokliknij węzeł, a następnie wybierz Wznów>Przywróć role.

Po wznowieniu działania serwera zostanie oznaczony jako Włączony w programie PowerShell i Failover Cluster Manager.

Poczekaj na ponowną synchronizację pamięci

Po wznowieniu działania serwera należy poczekać na ukończenie ponownej synchronizacji przed przełączenie innych serwerów w klastrze w tryb offline.

Uruchom następujące polecenie cmdlet jako administrator, aby monitorować postęp:

Get-StorageJob

Jeśli ponowna synchronizacja została już ukończona, nie uzyskasz żadnych danych wyjściowych.

Oto kilka przykładowych danych wyjściowych pokazujących zadania ponownej synchronizacji (naprawy), które wciąż działają.

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

W kolumnie BytesTotal przedstawiono ilość miejsca potrzebnego do ponownej synchronizacji magazynu. W kolumnie PercentComplete jest wyświetlany postęp.

Ostrzeżenie

Nie można bezpiecznie przejąć innego serwera w tryb offline, dopóki te zadania naprawy nie zakończą się.

W tym czasie w obszarze HealthStatus woluminy będą nadal wyświetlane jako Ostrzeżenie, co jest normalne.

Na przykład, jeśli używasz Get-VirtualDisk cmdlet podczas ponownej synchronizacji magazynu, być może zobaczysz następujący wynik:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Po zakończeniu zadań sprawdź, czy woluminy ponownie pokazują status zdrowe, używając polecenia Get-VirtualDisk cmdlet. Oto kilka przykładowych danych wyjściowych:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Teraz można bezpiecznie wstrzymać i ponownie uruchomić inne serwery w klastrze.

Następne kroki

Aby uzyskać powiązane informacje, zobacz również:

Udostępnij za pośrednictwem

Procedury konserwacji klastra przełączania awaryjnego

Przełącz serwer w tryb offline przy użyciu centrum administracyjnego systemu Windows

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Wstrzymywanie i opróżnianie serwera

Zamykanie serwera

Wznawianie działania serwera

Poczekaj na ponowną synchronizację pamięci

Przełącz serwer w tryb offline przy użyciu programu PowerShell

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Wstrzymywanie i opróżnianie serwera

Wprowadź dyski w tryb konserwacji

Zamykanie serwera

Wyjmij dyski z trybu konserwacji

Wznawianie działania serwera

Poczekaj na ponowną synchronizację pamięci

Następne kroki

Opinia

Dodatkowe zasoby