Azure Yerel üzerinde bir düğümü onarma
Şunlar için geçerlidir: Azure Yerel 2311.2 ve üzeri
Bu makalede, Azure Yerel örneğinizdeki bir düğümün nasıl onarıldığı açıklanır. Bu makalede, her sunucu bir düğüm olarak adlandırılır.
Onarım düğümleri hakkında
Azure Yerel, mevcut sistemlerden düğümleri onarmanızı sağlayan hiper yakınsanmış bir sistemdir. Donanım hatası olduğunda sistemdeki bir düğümü onarmanız gerekebilir.
Bir düğümü onarmadan önce, hangi bileşenlerin alan değiştirme birimleri (FRU) olduğunu ve kendi kendinize değiştirebileceğinizi, hangi bileşenlerin ise bir teknisyen tarafından değiştirilmesi gerektiğini çözüm sağlayıcınızla kontrol edin.
Çalışırken değiştirmeyi destekleyen parçalar genellikle, anakart gibi çalışırken değiştirilemeyen bileşenlerin aksine, düğümü yeniden yapılandırmanızı gerektirmez. Düğümü yeniden oluşturmanızı gerektirecek bileşen değişikliklerini belirlemek için donanım üreticinize başvurun. Daha fazla bilgi için bkz . Bileşen değiştirme.
Düğüm iş akışını onarma
Aşağıdaki akış diyagramında bir düğümü onarmaya ilişkin genel işlem gösterilmektedir.
*Düğüm kapatmanın mümkün veya gerekli olduğu bir durumda olmayabilir*
Mevcut bir düğümü onarmak için şu üst düzey adımları izleyin:
Mümkünse, onarmak istediğiniz düğümü kapatın. Düğümün durumuna bağlı olarak kapatma mümkün olmayabilir veya gerekli olmayabilir.
Onarılması gereken düğümü yeniden görüntüleyin.
Onarım düğümü işlemini çalıştırın. Azure Stack HCI İşletim Sistemi, sürücüler ve üretici yazılımı onarım işleminin bir parçası olarak güncelleştirilir.
Yeniden tasarlanan düğümde depolama otomatik olarak yeniden dengelenir. Depolama yeniden dengelemesi, düğüm sayısına ve kullanılan depolama alanına bağlı olarak birden çok gün boyunca çalışabilen düşük öncelikli bir görevdir.
Desteklenen senaryolar
Düğümün onarılması bir düğümü yeniden oluşturur ve önceki ad ve yapılandırmayla sisteme geri getirir.
Tek bir düğümün onarılması, veri birimlerini kalıcı hale getirme seçeneğiyle yeniden dağıtıma neden olur. Dağıtım sırasında yalnızca sistem birimi silinir ve yeni şekilde tahsis edilir.
Önemli
İş yükleriniz için her zaman yedekleriniz olduğundan ve yalnızca sistem dayanıklılığına güvenmediğinizden emin olun. Bu, özellikle tek düğümlü senaryolarda kritik önem taşır.
Dayanıklılık ayarları
Bu sürümde, onarım düğümü işlemi sırasında, dağıtımdan sonra oluşturduğunuz iş yükü hacimlerinde belirli görevler gerçekleştirilmez. Bir onarım düğümü işlemi için yalnızca gerekli altyapı hacimleri ve iş yükü hacimleri geri yüklenir ve küme paylaşılan birim (CSV) olarak sunulur.
Dağıtımdan sonra oluşturduğunuz diğer iş yükü birimleri hala korunur ve cmdlet'ini Get-VirtualDisk
çalıştırarak bu birimleri keşfedebilirsiniz. Birimin kilidini el ile açmanız (birimin BitLocker etkinleştirilmişse) ve bir CSV (gerekirse) oluşturmanız gerekir.
Donanım gereksinimleri
Bir düğümü onarırken sistem yeni gelen düğümün donanımını doğrular ve düğümün sisteme eklenmeden önce donanım gereksinimlerini karşıladığından emin olur.
Bileşen | Uyumluluk denetimi |
---|---|
Merkezi İşlem Birimi (CPU) | Yeni düğümün aynı sayıda veya daha fazla CPU çekirdeğine sahip olduğunu doğrulayın. Gelen düğümdeki CPU çekirdekleri bu gereksinimi karşılamıyorsa bir uyarı sunulur. Ancak işleme izin verilir. |
Bellek | Yeni düğümde aynı miktarda veya daha fazla belleğin yüklü olduğunu doğrulayın. Gelen düğümdeki bellek bu gereksinimi karşılamıyorsa bir uyarı sunulur. Ancak işleme izin verilir. |
Sürücüler | Yeni düğümün Depolama Alanları Doğrudan için kullanılabilen veri sürücüsü sayısıyla aynı olduğunu doğrulayın. Gelen düğümdeki sürücü sayısı bu gereksinimi karşılamıyorsa bir hata bildirilir ve işlem engellenir. |
Düğüm değiştirme
Bütün düğümü değiştirebilirsiniz.
- Eski düğümden farklı bir seri numarasına sahip yeni bir düğümle.
- Geçerli düğümle birlikte yeniden görüntüleyebilirsiniz.
Yeni düğüm değişimi sırasında aşağıdaki senaryolar desteklenir:
Düğüm | Disk | Destekleniyor |
---|---|---|
Yeni düğüm | Yeni diskler | Yes |
Yeni düğüm | Geçerli diskler | Yes |
Geçerli düğüm (yeniden tasarlanan) | Mevcut diskler yeniden biçimlendirildi | Hayır |
Geçerli düğüm (yeniden görüntülenen) | Yeni diskler | Yes |
Geçerli düğüm (yeniden biçimlendirilen) | Mevcut diskler | Yes |
**Depolama Alanları Doğrudan tarafından kullanılan diskler düzgün temizlik gerektirir. Yeniden biçimlendirme yeterli değildir. Sürücüleri nasıl temizleyeceğinizi görün.
Önemli
Düğüm onarımı sırasında bir bileşeni değiştirirseniz veri sürücülerini değiştirmeniz veya sıfırlamanız gerekmez. Bir sürücüyü değiştirir veya sıfırlarsanız, düğüm sisteme katıldıktan sonra sürücü tanınmaz.
Bileşen değiştirme
Azure Yerel örneğinizde, çalışırken değiştirilebilen olmayan bileşenler aşağıdaki öğeleri içerir:
- Anakart/ana kart yönetim denetleyicisi (BMC)/ekran kartı
- Disk denetleyicisi/ana bilgisayar veri yolu bağdaştırıcısı (HBA)/arka plaka
- Ağ bağdaştırıcısı
- Grafik işleme birimi
- Veri depolama sürücüleri (çalışırken değiştirme desteği olmayan sürücüler, örneğin PCI-e eklenti kartları)
Çalışırken değiştirilebilir olmayan bileşenler için gerçek değiştirme adımları, orijinal donanım üreticiniz (OEM) donanım satıcınıza göre değişir. Çalışırken değiştirilemeyen bileşenler için düğüm onarımı gerekiyorsa OEM satıcınızın belgelerine bakın.
Önkoşullar
Bir düğümü onarmadan önce şunları sağlamanız gerekir:
-
AzureStackLCMUser
Active Directory'de etkindir. Daha fazla bilgi için bkz . Active Directory'yi hazırlama. -
AzureStackLCMUser
veya eşdeğer izinlere sahip başka bir kullanıcı olarak oturum açılmış. - Kimlik bilgileri,
AzureStackLCMUser
için değişmedi.
Gerekirse, onarım için tanımladığınız düğümü çevrimdışına alın. Buradaki adımları izleyin:
- Çevrimdışına alınmadan önce düğümün sağlıklı olduğunu doğrulayın.
- Düğümü duraklatın ve boşaltın.
- Düğümü kapatın.
Düğümü onarma
Bu bölümde PowerShell kullanarak bir düğümü onarma, işlemin durumunu Repair-Server
izleme ve herhangi bir sorun varsa sorun giderme işlemleri açıklanmaktadır.
Önkoşulları gözden geçirdiğinizden emin olun.
Onarmaya çalıştığınız düğümde bu adımları izleyin.
Azure Stack HCI Yönetici rolü izinleriyle Azure portalında oturum açın. Azure Yerel örneğinizi dağıtmak için kullanılan kaynak grubuna gidin. Kaynak grubunda, onarmak istediğiniz hatalı düğüm için Azure Arc makine kaynağını belirleyin.
Azure Arc makine kaynağında Ayarlar > Kilitlerbölümüne gidin. Sağ bölmede bir kaynak kilidi görürsünüz.
Kilidi seçin ve ardından çöp kutusu simgesini seçerek kilidi silin.
Azure Arc makine kaynağının Genel Bakış sayfasında, sağ bölmede Silöğesini seçin. Bu eylem hatalı makine düğümünü silmelidir.
Onarmak istediğiniz düğüme işletim sistemini ve gerekli sürücüleri yükleyin. Azure Stack HCI İşletim Sistemi, sürüm 23H2'yi yükleme makalesindeki adımları izleyin.
Not
Azure Yerel örneğinizi özel depolama IP'lerini kullanarak dağıttıysanız düğüm onarıldıktan sonra depolama ağ bağdaştırıcılarına IP'leri el ile atamanız gerekir.
Düğümü Arc'a kaydedin. Arc'a kaydolma ve izinleri ayarlama makalesindeki adımları izleyin.
Nota
Arc'a kaydolmak için mevcut düğümlerle aynı parametreleri kullanmanız gerekir. Örneğin: Kaynak Grubu adı, Bölge, Abonelik ve Kiracı.
Onarılan düğüme aşağıdaki izinleri atayın:
- Azure Yerel Cihaz Yönetimi Rolü
- Key Vault Sırlar Kullanıcısı Daha fazla bilgi için bkz Düğüme izin atama.
Aynı Azure Yerel örneğinin üyesi olan başka bir düğümde bu adımları izleyin.
2405.3 öncesi bir sürüm çalıştırıyorsanız, çakışan dosyaları temizlemek için aşağıdaki komutu çalıştırmanız gerekir:
Get-ChildItem -Path "$env:SystemDrive\NugetStore" -Exclude Microsoft.AzureStack.Solution.LCMControllerWinService*,Microsoft.AzureStack.Role.Deployment.Service* | Remove-Item -Recurse -Force
Sistemin dağıtımı sırasında sağladığınız etki alanı kullanıcı kimlik bilgileriyle sistemin zaten üyesi olan düğümde oturum açın. Gelen düğümü onarmak için aşağıdaki komutu çalıştırın:
$Cred = Get-Credential Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
Not
Düğüm adı NetBIOS adı olmalıdır. Varsayılan olarak
LocalAdminCredential
parametresi, Windows işletim sistemi yüklemesi tarafından oluşturulan yerleşik Yönetici hesabıdır.İşlem kimliğini,
Repair-Server
komutu tarafından sağlanan çıktı olarak not edin. İşlemin ilerlemeRepair-Server
durumunu izlemek için bunu daha sonra kullanırsınız.
İşlemin ilerleme durumunu izleme
Düğüm ekleme işleminin ilerleme durumunu izlemek için şu adımları izleyin:
Aşağıdaki cmdlet'i çalıştırın ve önceki adımda yer alan işlem kimliğini belirtin.
$ID = "<Operation ID>" Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID
İşlem tamamlandıktan sonra arka plan depolama yeniden dengeleme işi çalışmaya devam eder. Depolama yeniden dengeleme işinin tamamlanmasını bekleyin. Bu depolama yeniden dengeleme işinin ilerleme durumunu doğrulamak için aşağıdaki cmdlet'i kullanın:
Get-VirtualDisk|Get-StorageJob
Depolama yeniden dengeleme işi tamamlandıysa, cmdlet bir çıkış döndürmez.
Kurtarma senaryoları
Aşağıdaki kurtarma senaryoları ve önerilen azaltma adımları, düğümü onarmak için tablolandırılmıştır:
Senaryo açıklaması | Risk azaltma | Destekleniyor mu? |
---|---|---|
Düğüm onarım işlemi başarısız oldu. | İşlemi tamamlamak için hatayı araştırın. |
Yes |
Onarım düğümü işlemi kısmen başarılı oldu, ancak yeni bir işletim sistemi yüklemesiyle başlamak zorunda kaldı. | Bu senaryoda düzenleyici (Yaşam Döngüsü Yöneticisi olarak da bilinir) bilgi deposunu yeni düğümle güncelleştirmiştir. Onarım düğümü senaryosunu kullanın. | Yes |
Sorun giderme
Bir düğümü onarırken başarısızlıklar veya hatalarla karşılaşırsanız, bunların çıktısını bir günlük dosyasında yakalayabilirsiniz.
Sistemin dağıtımı sırasında sağladığınız etki alanı kullanıcı kimlik bilgileriyle oturum açın. Sorunu günlük dosyalarında yakalayın.
Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
Başarısız işlemi yeniden çalıştırmak için aşağıdaki cmdlet'i kullanın:
Repair-Server -Rerun
Sonraki adımlar
Bir düğüm ekleme hakkında daha fazla bilgi edinin.