Bagikan melalui


Memperbaiki simpul di Azure Local

Berlaku untuk: Azure Local 2311.2 dan yang lebih baru

Artikel ini menjelaskan cara memperbaiki simpul pada instans Azure Local Anda. Dalam artikel ini, setiap server disebut sebagai simpul.

Tentang simpul perbaikan

Azure Local adalah sistem hyperconverged yang memungkinkan Anda memperbaiki simpul dari sistem yang ada. Anda mungkin perlu memperbaiki simpul dalam sistem jika ada kegagalan perangkat keras.

Sebelum Anda memperbaiki simpul, pastikan untuk memeriksa dengan penyedia solusi Anda, komponen mana pada simpul yang merupakan unit pengganti bidang (FRUs) yang dapat Anda ganti sendiri dan komponen mana yang akan mengharuskan teknisi untuk mengganti.

Bagian yang mendukung hot swap biasanya tidak mengharuskan Anda untuk menginstal ulang node, tidak seperti komponen yang tidak dapat di-hot swap seperti motherboard. Konsultasikan dengan produsen perangkat keras Anda untuk menentukan penggantian komponen mana yang mengharuskan Anda untuk mencitrakan ulang simpul. Untuk informasi selengkapnya, lihat Penggantian komponen.

Memperbaiki alur kerja simpul

Diagram alur berikut menunjukkan proses keseluruhan untuk memperbaiki simpul.

Diagram yang mengilustrasikan proses simpul perbaikan.

*Node mungkin tidak dalam keadaan di mana pematian dimungkinkan atau diperlukan*

Untuk memperbaiki simpul yang ada, ikuti langkah-langkah tingkat tinggi berikut:

  1. Jika memungkinkan, matikan simpul yang ingin Anda perbaiki. Tergantung pada status simpul, penghentian operasi mungkin tidak mungkin dilakukan atau tidak diperlukan.

  2. Gambar ulang node yang perlu diperbaiki.

  3. Jalankan operasi simpul perbaikan. Sistem Operasi, driver, dan firmware Azure Stack HCI diperbarui sebagai bagian dari operasi perbaikan.

    Penyimpanan secara otomatis diseimbangkan kembali pada simpul yang dicitra ulang. Penyeimbangan ulang penyimpanan adalah tugas prioritas rendah yang dapat berjalan selama beberapa hari tergantung pada jumlah simpul dan penyimpanan yang digunakan.

Skenario yang didukung

Memperbaiki simpul menggambarkan ulang simpul dan mengembalikannya ke sistem dengan nama dan konfigurasi sebelumnya.

Memperbaiki satu node menghasilkan penyebaran ulang dengan opsi untuk mempertahankan volume data. Selama penyebaran, hanya volume sistem yang dihapus dan disediakan ulang.

Penting

Pastikan Anda selalu memiliki cadangan untuk beban kerja Anda dan tidak hanya mengandalkan ketahanan sistem. Ini sangat penting dalam skenario simpul tunggal.

Pengaturan ketahanan

Dalam rilis ini, untuk operasi simpul pemeliharaan, tugas tertentu tidak dilakukan pada volume kerja yang Anda buat setelah penyebaran. Untuk operasi simpul perbaikan, hanya volume infrastruktur yang diperlukan dan volume beban kerja yang dipulihkan dan muncul sebagai volume bersama kluster (CSV).

Volume beban kerja lain yang Anda buat setelah penyebaran masih dipertahankan dan Anda dapat menemukan volume ini dengan menjalankan Get-VirtualDisk cmdlet. Anda harus membuka kunci volume secara manual (jika volume mengaktifkan BitLocker), dan membuat CSV (jika diperlukan).

Persyaratan perangkat keras

Saat memperbaiki simpul, sistem memvalidasi perangkat keras simpul baru yang masuk dan memastikan bahwa simpul memenuhi persyaratan perangkat keras sebelum ditambahkan ke sistem.

Komponen Pemeriksaan kepatuhan
CPU Validasi bahwa simpul baru memiliki jumlah inti CPU yang sama atau lebih banyak. Jika inti CPU pada simpul masuk tidak memenuhi persyaratan ini, peringatan akan ditampilkan. Namun, operasi ini diizinkan.
Memori Pastikan simpul baru memiliki jumlah memori yang sama atau lebih terpasang. Jika memori pada simpul masuk tidak memenuhi persyaratan ini, peringatan akan disajikan. Namun, operasi ini diizinkan.
Penggerak Pastikan bahwa simpul baru memiliki jumlah drive data yang sama tersedia untuk Storage Spaces Direct. Jika jumlah drive pada simpul masuk tidak memenuhi persyaratan ini, kesalahan akan dilaporkan dan operasi diblokir.

Penggantian node

Anda dapat mengganti seluruh simpul:

  • Dengan simpul baru yang memiliki nomor seri yang berbeda dibandingkan dengan simpul lama.
  • Dengan simpul saat ini setelah Anda menggambarnya kembali.

Skenario berikut didukung selama penggantian node:

Node Disk Didukung
Simpul baru Disk baru Ya
Simpul baru Disk penyimpanan saat ini Ya
Simpul saat ini (digambut ulang) Disk saat ini diformat ulang ** Tidak
Simpul saat ini (digambut ulang) Disk baru Ya
Simpul saat ini (digambut ulang) Disk saat ini Ya

**Disk yang telah digunakan oleh Ruang Penyimpanan Langsung memerlukan pembersihan yang tepat. Memformat ulang tidak cukup. Lihat cara Membersihkan drive penyimpanan.

Penting

Jika Anda mengganti komponen selama perbaikan simpul, Anda tidak perlu mengganti atau mengatur ulang drive data. Jika Anda mengganti drive atau meresetnya, maka drive tidak akan dikenali setelah node terhubung ke sistem.

Penggantian komponen

Pada instans Azure Lokal Anda, komponen yang tidak mendukung hot-swappable mencakup item berikut:

  • Pengontrol manajemen motherboard/baseboard (BMC)/kartu video
  • Pengontrol disk/adaptor bus host (HBA)/backplace
  • Adapter jaringan
  • Unit pemrosesan grafis
  • Drive data (drive yang tidak mendukung hot swap, misalnya kartu add-in PCI-e)

Langkah-langkah penggantian sebenarnya untuk komponen yang tidak mendukung hot-swap berbeda tergantung pada vendor perangkat keras dari produsen peralatan asli (OEM) Anda. Lihat dokumentasi vendor OEM Anda jika perbaikan node diperlukan untuk komponen yang tidak dapat ditukar dengan panas.

Prasyarat

Sebelum memperbaiki simpul, Anda harus memastikan bahwa:

  • AzureStackLCMUser aktif di Active Directory. Untuk informasi selengkapnya, lihat Menyiapkan Direktori Aktif.
  • Masuk sebagai AzureStackLCMUser atau pengguna lain dengan izin yang setara.
  • Kredensial untuk AzureStackLCMUser belum berubah.

Memperbaiki simpul

Bagian ini menjelaskan cara memperbaiki simpul menggunakan PowerShell, memantau status Repair-Server operasi dan memecahkan masalah, jika ada masalah.

Pastikan Anda telah meninjau prasyarat.

Ikuti langkah-langkah ini pada simpul yang coba Anda perbaiki.

  1. Masuk ke portal Microsoft Azure dengan izin peran Administrator Azure Stack HCI.

    1. Buka grup sumber daya yang digunakan untuk menyebarkan instans Azure Local Anda. Dalam grup sumber daya, identifikasi sumber daya komputer Azure Arc untuk simpul yang rusak yang ingin Anda perbaiki.

    2. Di sumber daya komputer Azure Arc, buka Pengaturan > Kunci. Di panel kanan, Anda akan melihat kunci sumber daya.

    3. Pilih kunci lalu pilih ikon tempat sampah untuk menghapus kunci.

      Cuplikan layar penghapusan kunci sumber daya pada simpul komputer Azure Arc yang rusak.

    4. Pada halaman Gambaran Umum sumber daya mesin Azure Arc, di bagian sebelah kanan, pilih Hapus. Tindakan ini harus menghapus simpul komputer yang rusak.

      Cuplikan layar penghapusan node mesin Azure Arc yang rusak.

  2. Instal sistem operasi dan driver yang diperlukan pada simpul yang ingin Anda perbaiki. Ikuti langkah-langkah dalam Menginstal Sistem Operasi Azure Stack HCI, versi 23H2.

    Catatan

    Jika Anda menyebarkan instans Azure Local menggunakan IP penyimpanan kustom, Anda harus menetapkan IP secara manual ke adaptor jaringan penyimpanan setelah node diperbaiki.

  3. Daftarkan simpul dengan Arc. Ikuti langkah-langkah dalam Mendaftar dengan Arc dan menyiapkan izin.

    Catatan

    Anda harus menggunakan parameter yang sama dengan simpul yang ada untuk mendaftar dengan Arc. Misalnya: Nama Grup Sumber Daya, Wilayah, Langganan, dan Penyewa.

  4. Tetapkan izin berikut ke simpul yang diperbaiki:

    • Peran Manajemen Perangkat Lokal Azure
    • Pengguna Rahasia Key Vault Untuk informasi selengkapnya, lihat Menetapkan izin ke simpul.

Ikuti langkah-langkah ini pada simpul lain yang merupakan anggota instans Azure Local yang sama.

  1. Jika Anda menjalankan versi sebelum 2405.3, Anda harus menjalankan perintah berikut untuk membersihkan file yang berkonflik:

    Get-ChildItem -Path "$env:SystemDrive\NugetStore" -Exclude Microsoft.AzureStack.Solution.LCMControllerWinService*,Microsoft.AzureStack.Role.Deployment.Service* | Remove-Item -Recurse -Force
    
  2. Masuk ke node yang sudah menjadi anggota sistem, dengan kredensial pengguna domain yang Anda berikan selama penerapan sistem. Jalankan perintah berikut untuk memperbaiki simpul masuk:

    $Cred = Get-Credential 
    Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
    

    Catatan

    Nama simpul harus berupa nama NetBIOS. Parameter LocalAdminCredential secara default, adalah akun Administrator bawaan yang dibuat oleh penginstalan OS Windows.

  3. Catat ID operasi sebagai output perintah Repair-Server. Anda menggunakan ini nanti untuk memantau kemajuan operasi Repair-Server.

Memantau kemajuan operasi

Untuk memantau kemajuan operasi tambahkan simpul, ikuti langkah-langkah berikut:

  1. Jalankan cmdlet berikut dan berikan ID operasi dari langkah sebelumnya.

    $ID = "<Operation ID>" 
    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID 
    
  2. Setelah operasi selesai, pekerjaan penyeimbangan ulang penyimpanan latar belakang akan terus berjalan. Tunggu hingga pekerjaan penyeimbangan ulang penyimpanan selesai. Untuk memverifikasi kemajuan pekerjaan penyeimbangan ulang penyimpanan ini, gunakan cmdlet berikut:

    Get-VirtualDisk|Get-StorageJob
    

    Jika pekerjaan penyeimbangan ulang penyimpanan selesai, cmdlet tidak akan mengembalikan output.

Skenario pemulihan

Skenario pemulihan berikut dan langkah-langkah mitigasi yang direkomendasikan ditabulasikan untuk memperbaiki simpul:

Deskripsi Skenario Mitigasi Didukung?
Operasi simpul perbaikan gagal. Untuk menyelesaikan operasi, selidiki kegagalan.
Jalankan ulang operasi yang gagal menggunakan Repair-Server -Rerun.
Ya
Operasi simpul perbaikan berhasil sebagian tetapi harus dimulai dengan penginstalan sistem operasi baru. Dalam skenario ini, orkestrator (juga dikenal sebagai Lifecycle Manager) telah memperbarui penyimpanan pengetahuannya dengan simpul baru. Gunakan skenario simpul perbaikan. Ya

Pemecahan Masalah

Jika Anda mengalami kegagalan atau kesalahan saat memperbaiki simpul, Anda dapat mengambil output kegagalan dalam file log.

  • Masuk dengan kredensial pengguna domain yang Anda berikan selama penyebaran sistem. Tangkap masalah dalam file log.

    Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
    
  • Untuk menjalankan ulang operasi yang gagal, gunakan cmdlet berikut:

    Repair-Server -Rerun
    

Langkah berikutnya

Pelajari selengkapnya tentang cara Menambahkan simpul.