Procedury konserwacji klastra przełączania awaryjnego
Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Ważne
Usługa Azure Stack HCI jest teraz częścią usługi Azure Local. Jednak starsze wersje rozwiązania Azure Stack HCI, na przykład 22H2 będą nadal odwoływać się do rozwiązania Azure Stack HCI i nie będą odzwierciedlać zmiany nazwy. Dowiedz się więcej.
W tym artykule założono, że konieczne jest wyłączenie serwera fizycznego w celu przeprowadzenia konserwacji lub ponowne uruchomienie go z jakiegoś powodu. Aby zainstalować aktualizacje w klastrze usługi Azure Stack HCI bez przełączeń serwerów w tryb offline, zobacz Aktualizowanie klastrów rozwiązania Azure Stack HCI.
Wyłączenie serwera w celu konserwacji wymaga wyłączenia części magazynu, które są współużytkowane przez wszystkie serwery w klastrze awaryjnym. Wymaga to wstrzymania serwera, który ma zostać przełączony w tryb offline, umieszczenie dysków serwera w trybie konserwacji, przeniesienie ról klastrowanych i maszyn wirtualnych do innych serwerów w klastrze oraz sprawdzenie, czy wszystkie dane są dostępne na innych serwerach w klastrze. Ten proces gwarantuje, że dane pozostają bezpieczne i dostępne przez cały okres konserwacji.
Możesz użyć centrum administracyjnego systemu Windows lub programu PowerShell, aby przejąć serwer w tryb offline na potrzeby konserwacji. W tym temacie omówiono obie metody.
Przełącz serwer w tryb offline przy użyciu centrum administracyjnego systemu Windows
Najprostszym sposobem przygotowania do przełączenie serwera w tryb offline jest użycie centrum administracyjnego systemu Windows.
Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline
Za pomocą programu Windows Admin Center nawiąż połączenie z serwerem, który chcesz przełączyć w tryb offline. Wybierz
Dyski pamięci z menu Narzędzia , i sprawdź, czy w kolumnieStan dla każdego dysku wirtualnego jest wyświetlana wartośćOnline .Następnie wybierz pozycję > magazynu i sprawdź, czy kolumna Kondycja dla każdego woluminu ma wartość W dobrej kondycji i czy kolumna Stan dla każdego woluminu jest wyświetlana ok.
Wstrzymywanie i opróżnianie serwera
Przed zamknięciem lub ponownym uruchomieniem serwera należy wstrzymać serwer i opróżnić (przenieść) wszystkie role klastrowane, takie jak maszyny wirtualne uruchomione na nim. Zawsze wstrzymuj i opróżniaj klastrowane serwery przed przełączeniem ich w tryb offline w celu przeprowadzenia konserwacji.
Za pomocą programu Windows Admin Center połącz się z klastrem, a następnie wybierz pozycję > obliczeniowe z menu Narzędzia w Menedżerze klastra.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wstrzymać i opróżnić, a następnie wybierz pozycję Wstrzymaj. Powinien zostać wyświetlony następujący monit:
Wstrzymaj serwery na potrzeby konserwacji: Czy na pewno chcesz wstrzymać serwery? Spowoduje to przeniesienie obciążeń, takich jak maszyny wirtualne, do innych serwerów w klastrze.
Wybierz pozycję Tak , aby wstrzymać serwer i zainicjować proces opróżniania. Stan serwera będzie wyświetlany jako W konserwacji, przenoszenie zadań, a role, takie jak Hyper-V i maszyny wirtualne, natychmiast rozpoczną migrację na żywo do innych serwerów w klastrze. Może to potrwać kilka minut. Do momentu wznowienia nie można dodać ról do serwera. Po zakończeniu procesu opróżniania stan serwera będzie wyświetlany jako W konserwacji, Opróżnianie ukończone. System operacyjny przeprowadza automatyczną kontrolę bezpieczeństwa, aby upewnić się, że jest bezpieczny do kontynuowania. Jeśli istnieją niezdrowe woluminy, to zatrzyma się i ostrzeże Cię, że nie jest bezpiecznie kontynuować.
Zamykanie serwera
Po zakończeniu opróżniania serwera można bezpiecznie zamknąć go w celu konserwacji lub ponownego uruchomienia.
Ostrzeżenie
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, przed zamknięciem serwera należy umieścić dyski w trybie konserwacji i wycofać dyski z trybu konserwacji przed wznowieniem serwera w klastrze.
Wznawianie działania serwera
Gdy serwer będzie gotowy do ponownego rozpoczęcia hostowania ról klastrowanych i maszyn wirtualnych, po prostu włącz serwer, zaczekaj na jego uruchomienie i wznów działanie serwera, wykonując następujące kroki.
W Menedżerze klastra wybierz pozycję > obliczeniowe z menu Narzędzia po lewej stronie.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wznowić, a następnie kliknij przycisk Wznów.
Role klastrowane i maszyny wirtualne natychmiast rozpoczną migrację na żywo z powrotem do serwera. Może to potrwać kilka minut.
Poczekaj na ponowną synchronizację pamięci
Po wznowieniu działania serwera wszystkie nowe zapisy, które wystąpiły, gdy był niedostępny, muszą zostać ponownie zsynchronizowane. Dzieje się to automatycznie przy użyciu inteligentnego śledzenia zmian. Nie jest to konieczne, aby wszystkie dane zostały przeskanowane ani zsynchronizowane; tylko zmiany. Ten proces jest ograniczany w celu ograniczenia wpływu na obciążenia produkcyjne. W zależności od czasu wstrzymania serwera i ilości zapisanych nowych danych może upłynąć wiele minut.
Ważne
Przed przełączenie innych serwerów w klastrze w tryb offline należy poczekać na ukończenie ponownej synchronizacji.
Aby sprawdzić, czy ponowna synchronizacja magazynu została ukończona:
- Połącz się z klastrem przy użyciu Centrum administracyjnego systemu Windows i wybierz Magazyn > Woluminy.
- Wybierz Zapasy.
- Sprawdź kolumnę Stan dla każdego woluminu. Jeśli wyświetli się OK, synchronizacja magazynu została zakończona. Teraz można bezpiecznie wyłączyć inne serwery w klastrze.
Przełącz serwer w tryb offline przy użyciu programu PowerShell
Użyj poniższych procedur, aby prawidłowo wstrzymać, opróżnić i wznowić serwer w klastrze trybu failover przy użyciu programu PowerShell.
Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline
Aby sprawdzić, czy wszystkie woluminy są w dobrej kondycji, uruchom następujące polecenie cmdlet jako administrator:
Get-VirtualDisk
Oto przykład tego, jak mogą wyglądać dane wyjściowe:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Sprawdź, czy właściwość HealthStatus dla każdego woluminu jest w dobrej kondycji, a wartość OperationalStatus pokazuje ok.
Aby to zrobić przy użyciu Menedżera klastra failover, przejdź do Magazyn>Dyski.
Wstrzymywanie i opróżnianie serwera
Uruchom następujące polecenie cmdlet jako administrator, aby wstrzymać i opróżnić serwer:
Suspend-ClusterNode -Drain
Aby to zrobić w Menedżerze klastra trybu failover, przejdź do Węzły, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz Wstrzymaj>Opróżnij role.
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, wstrzymanie i opróżnienie serwera spowoduje również przełączenie dysków serwera w tryb konserwacji. Jeśli na serwerze działa rozwiązanie Azure Stack HCI w wersji 20H2, Windows Server 2019 lub Windows Server 2016, musisz to zrobić ręcznie (zobacz następny krok).
Wprowadź dyski w tryb konserwacji
W usłudze Azure Stack HCI w wersji 20H2, Windows Server 2019 i Windows Server 2016, umieszczenie dysków serwera w trybie konserwacji daje Storage Spaces Direct możliwość spokojnego opróżniania i zatwierdzania danych, aby zapewnić, że zamknięcie serwera nie wpływa na stan aplikacji. Gdy tylko dysk przejdzie do trybu konserwacji, nie będzie już zezwalać na zapisy. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy umieszczenie dysków w tryb konserwacji bezpośrednio przed ponownym uruchomieniem i wyprowadzenie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.
Uwaga
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski są automatycznie umieszczane w trybie konserwacji po wstrzymaniu i opróżnieniu serwera. Te systemy operacyjne mają szczegółową funkcję naprawy, która sprawia, że ponowne synchronizowanie jest szybsze i mniej wpływające na zasoby systemowe i sieciowe, dzięki czemu można wykonać konserwację serwera i magazynu razem.
Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Zamykanie serwera
Po zakończeniu opróżniania serwera będzie on wyświetlany jako Wstrzymany w programie PowerShell i Menedżerze klastra trybu failover.
Teraz można bezpiecznie zamknąć serwer lub uruchomić go ponownie za pomocą Stop-Computer
poleceń cmdlet programu PowerShell lub Restart-Computer
przy użyciu Menedżera klastra trybu failover.
Uwaga
W przypadku uruchamiania polecenia Get-VirtualDisk
na serwerach, na których następuje zamykanie lub uruchamianie/zatrzymywanie usługi klastra, status operacyjny serwera może być zgłaszany jako niekompletny lub pogorszony, a kolumna Stan zdrowia może zawierać ostrzeżenie. Jest to normalne i nie powinno powodować niepokoju. Wszystkie woluminy pozostają w trybie online i są dostępne.
Wyjmij dyski z trybu konserwacji
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, należy wyłączyć tryb konserwacji magazynu na dyskach przed wznowieniem serwera w klastrze. Aby zminimalizować czas ponownej synchronizacji pamięci, zalecamy wyjęcie ich z trybu konserwacji, gdy tylko system zacznie znowu działać.
Uwaga
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski zostaną automatycznie wyjęte z trybu konserwacji po wznowieniu serwera.
Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator, aby wyłączyć tryb konserwacji pamięci masowej.
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Wznawianie działania serwera
Wznów serwer w klastrze. Aby zwrócić role klastrowane i maszyny wirtualne, które były wcześniej uruchomione na serwerze, użyj opcjonalnej flagi -Failback :
Resume-ClusterNode –Failback Immediate
Aby to zrobić w Menedżerze klastra awaryjnego, przejdź do Węzły, prawokliknij węzeł, a następnie wybierz Wznów>Przywróć role.
Po wznowieniu działania serwera zostanie oznaczony jako Włączony w programie PowerShell i Failover Cluster Manager.
Poczekaj na ponowną synchronizację pamięci
Po wznowieniu działania serwera należy poczekać na ukończenie ponownej synchronizacji przed przełączenie innych serwerów w klastrze w tryb offline.
Uruchom następujące polecenie cmdlet jako administrator, aby monitorować postęp:
Get-StorageJob
Jeśli ponowna synchronizacja została już ukończona, nie uzyskasz żadnych danych wyjściowych.
Oto kilka przykładowych danych wyjściowych pokazujących zadania ponownej synchronizacji (naprawy), które wciąż działają.
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
W kolumnie BytesTotal przedstawiono ilość miejsca potrzebnego do ponownej synchronizacji magazynu. W kolumnie PercentComplete jest wyświetlany postęp.
Ostrzeżenie
Nie można bezpiecznie przejąć innego serwera w tryb offline, dopóki te zadania naprawy nie zakończą się.
W tym czasie w obszarze HealthStatus woluminy będą nadal wyświetlane jako Ostrzeżenie, co jest normalne.
Na przykład, jeśli używasz Get-VirtualDisk
cmdlet podczas ponownej synchronizacji magazynu, być może zobaczysz następujący wynik:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Po zakończeniu zadań sprawdź, czy woluminy ponownie pokazują status zdrowe, używając polecenia Get-VirtualDisk
cmdlet. Oto kilka przykładowych danych wyjściowych:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Teraz można bezpiecznie wstrzymać i ponownie uruchomić inne serwery w klastrze.
Następne kroki
Aby uzyskać powiązane informacje, zobacz również: