Memperbaiki simpul di Azure Local
Berlaku untuk: Azure Local 2311.2 dan yang lebih baru
Artikel ini menjelaskan cara memperbaiki simpul pada instans Azure Local Anda. Dalam artikel ini, setiap server disebut sebagai simpul.
Tentang simpul perbaikan
Azure Local adalah sistem hyperconverged yang memungkinkan Anda memperbaiki simpul dari sistem yang ada. Anda mungkin perlu memperbaiki simpul dalam sistem jika ada kegagalan perangkat keras.
Sebelum Anda memperbaiki simpul, pastikan untuk memeriksa dengan penyedia solusi Anda, komponen mana pada simpul yang merupakan unit pengganti bidang (FRUs) yang dapat Anda ganti sendiri dan komponen mana yang akan mengharuskan teknisi untuk mengganti.
Bagian yang mendukung hot swap biasanya tidak mengharuskan Anda untuk menginstal ulang node, tidak seperti komponen yang tidak dapat di-hot swap seperti motherboard. Konsultasikan dengan produsen perangkat keras Anda untuk menentukan penggantian komponen mana yang mengharuskan Anda untuk mencitrakan ulang simpul. Untuk informasi selengkapnya, lihat Penggantian komponen.
Memperbaiki alur kerja simpul
Diagram alur berikut menunjukkan proses keseluruhan untuk memperbaiki simpul.
*Node mungkin tidak dalam keadaan di mana pematian dimungkinkan atau diperlukan*
Untuk memperbaiki simpul yang ada, ikuti langkah-langkah tingkat tinggi berikut:
Jika memungkinkan, matikan simpul yang ingin Anda perbaiki. Tergantung pada status simpul, penghentian operasi mungkin tidak mungkin dilakukan atau tidak diperlukan.
Gambar ulang node yang perlu diperbaiki.
Jalankan operasi simpul perbaikan. Sistem Operasi, driver, dan firmware Azure Stack HCI diperbarui sebagai bagian dari operasi perbaikan.
Penyimpanan secara otomatis diseimbangkan kembali pada simpul yang dicitra ulang. Penyeimbangan ulang penyimpanan adalah tugas prioritas rendah yang dapat berjalan selama beberapa hari tergantung pada jumlah simpul dan penyimpanan yang digunakan.
Skenario yang didukung
Memperbaiki simpul menggambarkan ulang simpul dan mengembalikannya ke sistem dengan nama dan konfigurasi sebelumnya.
Memperbaiki satu node menghasilkan penyebaran ulang dengan opsi untuk mempertahankan volume data. Selama penyebaran, hanya volume sistem yang dihapus dan disediakan ulang.
Penting
Pastikan Anda selalu memiliki cadangan untuk beban kerja Anda dan tidak hanya mengandalkan ketahanan sistem. Ini sangat penting dalam skenario simpul tunggal.
Pengaturan ketahanan
Dalam rilis ini, untuk operasi simpul pemeliharaan, tugas tertentu tidak dilakukan pada volume kerja yang Anda buat setelah penyebaran. Untuk operasi simpul perbaikan, hanya volume infrastruktur yang diperlukan dan volume beban kerja yang dipulihkan dan muncul sebagai volume bersama kluster (CSV).
Volume beban kerja lain yang Anda buat setelah penyebaran masih dipertahankan dan Anda dapat menemukan volume ini dengan menjalankan Get-VirtualDisk
cmdlet. Anda harus membuka kunci volume secara manual (jika volume mengaktifkan BitLocker), dan membuat CSV (jika diperlukan).
Persyaratan perangkat keras
Saat memperbaiki simpul, sistem memvalidasi perangkat keras simpul baru yang masuk dan memastikan bahwa simpul memenuhi persyaratan perangkat keras sebelum ditambahkan ke sistem.
Komponen | Pemeriksaan kepatuhan |
---|---|
CPU | Validasi bahwa simpul baru memiliki jumlah inti CPU yang sama atau lebih banyak. Jika inti CPU pada simpul masuk tidak memenuhi persyaratan ini, peringatan akan ditampilkan. Namun, operasi ini diizinkan. |
Memori | Pastikan simpul baru memiliki jumlah memori yang sama atau lebih terpasang. Jika memori pada simpul masuk tidak memenuhi persyaratan ini, peringatan akan disajikan. Namun, operasi ini diizinkan. |
Penggerak | Pastikan bahwa simpul baru memiliki jumlah drive data yang sama tersedia untuk Storage Spaces Direct. Jika jumlah drive pada simpul masuk tidak memenuhi persyaratan ini, kesalahan akan dilaporkan dan operasi diblokir. |
Penggantian node
Anda dapat mengganti seluruh simpul:
- Dengan simpul baru yang memiliki nomor seri yang berbeda dibandingkan dengan simpul lama.
- Dengan simpul saat ini setelah Anda menggambarnya kembali.
Skenario berikut didukung selama penggantian node:
Node | Disk | Didukung |
---|---|---|
Simpul baru | Disk baru | Ya |
Simpul baru | Disk penyimpanan saat ini | Ya |
Simpul saat ini (digambut ulang) | Disk saat ini diformat ulang ** | Tidak |
Simpul saat ini (digambut ulang) | Disk baru | Ya |
Simpul saat ini (digambut ulang) | Disk saat ini | Ya |
**Disk yang telah digunakan oleh Ruang Penyimpanan Langsung memerlukan pembersihan yang tepat. Memformat ulang tidak cukup. Lihat cara Membersihkan drive penyimpanan.
Penting
Jika Anda mengganti komponen selama perbaikan simpul, Anda tidak perlu mengganti atau mengatur ulang drive data. Jika Anda mengganti drive atau meresetnya, maka drive tidak akan dikenali setelah node terhubung ke sistem.
Penggantian komponen
Pada instans Azure Lokal Anda, komponen yang tidak mendukung hot-swappable mencakup item berikut:
- Pengontrol manajemen motherboard/baseboard (BMC)/kartu video
- Pengontrol disk/adaptor bus host (HBA)/backplace
- Adapter jaringan
- Unit pemrosesan grafis
- Drive data (drive yang tidak mendukung hot swap, misalnya kartu add-in PCI-e)
Langkah-langkah penggantian sebenarnya untuk komponen yang tidak mendukung hot-swap berbeda tergantung pada vendor perangkat keras dari produsen peralatan asli (OEM) Anda. Lihat dokumentasi vendor OEM Anda jika perbaikan node diperlukan untuk komponen yang tidak dapat ditukar dengan panas.
Prasyarat
Sebelum memperbaiki simpul, Anda harus memastikan bahwa:
-
AzureStackLCMUser
aktif di Active Directory. Untuk informasi selengkapnya, lihat Menyiapkan Direktori Aktif. - Masuk sebagai
AzureStackLCMUser
atau pengguna lain dengan izin yang setara. - Kredensial untuk
AzureStackLCMUser
belum berubah.
Jika diperlukan, ambil simpul yang telah Anda identifikasi untuk diperbaiki secara offline. Ikuti langkah-langkahnya di sini:
Memperbaiki simpul
Bagian ini menjelaskan cara memperbaiki simpul menggunakan PowerShell, memantau status Repair-Server
operasi dan memecahkan masalah, jika ada masalah.
Pastikan Anda telah meninjau prasyarat.
Ikuti langkah-langkah ini pada simpul yang coba Anda perbaiki.
Masuk ke portal Microsoft Azure dengan izin peran Administrator Azure Stack HCI.
Buka grup sumber daya yang digunakan untuk menyebarkan instans Azure Local Anda. Dalam grup sumber daya, identifikasi sumber daya komputer Azure Arc untuk simpul yang rusak yang ingin Anda perbaiki.
Di sumber daya komputer Azure Arc, buka Pengaturan > Kunci. Di panel kanan, Anda akan melihat kunci sumber daya.
Pilih kunci lalu pilih ikon tempat sampah untuk menghapus kunci.
Pada halaman Gambaran Umum sumber daya mesin Azure Arc, di bagian sebelah kanan, pilih Hapus. Tindakan ini harus menghapus simpul komputer yang rusak.
Instal sistem operasi dan driver yang diperlukan pada simpul yang ingin Anda perbaiki. Ikuti langkah-langkah dalam Menginstal Sistem Operasi Azure Stack HCI, versi 23H2.
Catatan
Jika Anda menyebarkan instans Azure Local menggunakan IP penyimpanan kustom, Anda harus menetapkan IP secara manual ke adaptor jaringan penyimpanan setelah node diperbaiki.
Daftarkan simpul dengan Arc. Ikuti langkah-langkah dalam Mendaftar dengan Arc dan menyiapkan izin.
Catatan
Anda harus menggunakan parameter yang sama dengan simpul yang ada untuk mendaftar dengan Arc. Misalnya: Nama Grup Sumber Daya, Wilayah, Langganan, dan Penyewa.
Tetapkan izin berikut ke simpul yang diperbaiki:
- Peran Manajemen Perangkat Lokal Azure
- Pengguna Rahasia Key Vault Untuk informasi selengkapnya, lihat Menetapkan izin ke simpul.
Ikuti langkah-langkah ini pada simpul lain yang merupakan anggota instans Azure Local yang sama.
Jika Anda menjalankan versi sebelum 2405.3, Anda harus menjalankan perintah berikut untuk membersihkan file yang berkonflik:
Get-ChildItem -Path "$env:SystemDrive\NugetStore" -Exclude Microsoft.AzureStack.Solution.LCMControllerWinService*,Microsoft.AzureStack.Role.Deployment.Service* | Remove-Item -Recurse -Force
Masuk ke node yang sudah menjadi anggota sistem, dengan kredensial pengguna domain yang Anda berikan selama penerapan sistem. Jalankan perintah berikut untuk memperbaiki simpul masuk:
$Cred = Get-Credential Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
Catatan
Nama simpul harus berupa nama NetBIOS. Parameter
LocalAdminCredential
secara default, adalah akun Administrator bawaan yang dibuat oleh penginstalan OS Windows.Catat ID operasi sebagai output perintah
Repair-Server
. Anda menggunakan ini nanti untuk memantau kemajuan operasiRepair-Server
.
Memantau kemajuan operasi
Untuk memantau kemajuan operasi tambahkan simpul, ikuti langkah-langkah berikut:
Jalankan cmdlet berikut dan berikan ID operasi dari langkah sebelumnya.
$ID = "<Operation ID>" Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID
Setelah operasi selesai, pekerjaan penyeimbangan ulang penyimpanan latar belakang akan terus berjalan. Tunggu hingga pekerjaan penyeimbangan ulang penyimpanan selesai. Untuk memverifikasi kemajuan pekerjaan penyeimbangan ulang penyimpanan ini, gunakan cmdlet berikut:
Get-VirtualDisk|Get-StorageJob
Jika pekerjaan penyeimbangan ulang penyimpanan selesai, cmdlet tidak akan mengembalikan output.
Skenario pemulihan
Skenario pemulihan berikut dan langkah-langkah mitigasi yang direkomendasikan ditabulasikan untuk memperbaiki simpul:
Deskripsi Skenario | Mitigasi | Didukung? |
---|---|---|
Operasi simpul perbaikan gagal. | Untuk menyelesaikan operasi, selidiki kegagalan. Jalankan ulang operasi yang gagal menggunakan Repair-Server -Rerun . |
Ya |
Operasi simpul perbaikan berhasil sebagian tetapi harus dimulai dengan penginstalan sistem operasi baru. | Dalam skenario ini, orkestrator (juga dikenal sebagai Lifecycle Manager) telah memperbarui penyimpanan pengetahuannya dengan simpul baru. Gunakan skenario simpul perbaikan. | Ya |
Pemecahan Masalah
Jika Anda mengalami kegagalan atau kesalahan saat memperbaiki simpul, Anda dapat mengambil output kegagalan dalam file log.
Masuk dengan kredensial pengguna domain yang Anda berikan selama penyebaran sistem. Tangkap masalah dalam file log.
Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
Untuk menjalankan ulang operasi yang gagal, gunakan cmdlet berikut:
Repair-Server -Rerun
Langkah berikutnya
Pelajari selengkapnya tentang cara Menambahkan simpul.