Aracılığıyla paylaş


InfiniBand'i ayarlama

Bu makalede, Kullanım Süresi Sonu (EOL) durumuna yakın bir Linux dağıtımı olan CentOS'a başvuruda bulunur. Lütfen kullanımınızı göz önünde bulundurun ve uygun şekilde planlayın. Daha fazla bilgi için bkz . CentOS Kullanım Süresi Sonu kılavuzu.

Şunlar için geçerlidir: ✔️ Linux VM'leri ✔️ Windows VM'leri ✔️ Esnek ölçek kümeleri ✔️ Tekdüzen ölçek kümeleri

Bu makalede, InfiniBand (IB) ağı üzerinden kullanılacak RDMA özellikli örnekler hakkında bazı bilgiler paylaşılır. InfiniBand ağ mimarisi, tam bir yağ ağacı tasarımına (yüksek bant genişliği ve düşük gecikme süresi sağlayan bir ağ topolojisi) sahiptir ve engelleyici olmayan, bisectional simetri sağlar. Bu yapılandırma, aynı sanal makine ölçek kümesindeki (VMSS) iki sanal makine (VM) arasında eşit bant genişliği sağlar.

RDMA özellikli örnekler

HPC VM boyutlarının çoğu, uzaktan doğrudan bellek erişimi (RDMA) bağlantısı için bir ağ arabirimine sahiptir. 'r' ile belirlenen seçili N serisi boyutları da RDMA özelliklidir. Bu arabirim, diğer VM boyutlarında kullanılabilen standart Azure Ethernet ağ arabirimine ek olarak sağlanır.

Bu ikincil arabirim, H16r, H16mr ve diğer RDMA özellikli N serisi sanal makineler için HBv4, HBv3, HBv2, EDR hızları, H16r, HX, NDv2 ve FDR hızları için HDR hızlarında çalışan RDMA özellikli örneklerin Bir InfiniBand ağı üzerinden iletişim kurmasını sağlar. Bu RDMA özellikleri İleti Geçirme Arabirimi (MPI) tabanlı uygulamaların ölçeklenebilirliğini ve performansını artırabilir.

Not

SR-IOV desteği: Azure HPC'de şu anda InfiniBand için SR-IOV'yi etkinleştirip etkinleştirmediklerine bağlı olarak iki vm sınıfı vardır. Şu anda, Azure'da yeni nesil, RDMA özellikli veya InfiniBand özellikli VM'lerin neredeyse tümü H16r, H16mr ve NC24r dışında SR-IOV etkindir. RDMA yalnızca InfiniBand ağı üzerinden etkinleştirilir ve tüm RDMA özellikli VM'ler için desteklenir. IB üzerinden IP yalnızca SR-IOV özellikli VM'lerde desteklenir. RDMA, Ethernet ağı üzerinden etkinleştirilmedi.

  • İşletim Sistemi - CentOS, RHEL, AlmaLinux, Ubuntu, SUSE gibi Linux dağıtımları yaygın olarak kullanılır. Windows Server 2016 ve daha yeni sürümler tüm HPC serisi VM'lerde desteklenir. Windows Server 2012 R2'nin HBv2'de 64'ten fazla (sanal veya fiziksel) çekirdeğe sahip VM boyutları olarak desteklenmediğini unutmayın. Azure Market desteklenen Linux VM görüntülerinin listesi ve bunların nasıl uygun şekilde yapılandırılabildiği için bkz. VM Görüntüleri. İlgili VM boyutu sayfaları, yazılım yığını desteğini de listeler.

  • InfiniBand ve Sürücüler - InfiniBand özellikli VM'lerde RDMA'yı etkinleştirmek için uygun sürücüler gereklidir. Vm uzantıları veya InfiniBand sürücülerinin el ile yüklenmesi hakkında bilgi edinmek için bkz. InfiniBand'i etkinleştirme.

  • MPI - Azure'da SR-IOV özellikli VM boyutları, Mellanox OFED ile neredeyse tüm MPI türlerinin kullanılmasına olanak sağlar. Azure'da HPC VM'lerinde MPI ayarlama hakkında daha fazla bilgi için bkz. HPC için MPI'yi ayarlama.

    Not

    RDMA ağ adres alanı: Azure'daki RDMA ağı 172.16.0.0/16 adres alanını ayırır. MPI uygulamalarını bir Azure sanal ağında dağıtılan örneklerde çalıştırmak için sanal ağ adres alanının RDMA ağıyla çakışmadığından emin olun.

Küme yapılandırma seçenekleri

Azure, RDMA ağını kullanarak iletişim kurabilen HPC VM kümeleri oluşturmak için çeşitli seçenekler sağlar:

  • Sanal makineler - RDMA özellikli HPC VM'lerini aynı ölçek kümesinde veya kullanılabilirlik kümesinde (Azure Resource Manager dağıtım modelini kullandığınızda) dağıtın. Klasik dağıtım modelini kullanıyorsanız VM'leri aynı bulut hizmetinde dağıtın.

  • Sanal makine ölçek kümeleri - Sanal makine ölçek kümesinde, ölçek kümesi içinde InfiniBand iletişimi için dağıtımı tek bir yerleştirme grubuyla sınırladığınızdan emin olun. Örneğin, Resource Manager şablonunda özelliğini olarak trueayarlayınsinglePlacementGroup.

En yüksek ölçek kümesi boyutunun singlePlacementGroup=true varsayılan olarak 100 VM'de eşlendiğini unutmayın. HPC iş ölçeği gereksinimleriniz tek bir kiracıda 100 VM'den yüksekse, bir artış isteyebilir, ücretsiz olarak çevrimiçi müşteri destek isteği açabilirsiniz. Tek bir ölçek kümesindeki VM sayısı sınırı 300'e artırılabilir. Kullanılabilirlik Kümelerini kullanarak VM'leri dağıtırken, Kullanılabilirlik Kümesi başına en fazla 200 VM sınırı olduğunu unutmayın.

Ayrıca, VMSS aynı küme içindeki iş yükleri arasında yalıtım sınırı görevi görür ve güvenliği garanti etmek için farklı VMSS'lerdeki örneklerin birbirinden yalıtılmış kalmasını sağlar.

Not

Sanal makineler arasında MPI: Sanal makineler arasında RDMA (örneğin MPI iletişimi kullanmak) gerekiyorsa, VM'lerin aynı sanal makine ölçek kümesinde veya kullanılabilirlik kümesinde olduğundan emin olun.

  • Azure CycleCloud - MPI işlerini çalıştırmak için Azure CycleCloud kullanarak bir HPC kümesi oluşturun.

  • Azure Batch - MPI iş yüklerini çalıştırmak için bir Azure Batch havuzu oluşturun. Azure Batch ile MPI uygulamaları çalıştırırken işlem yoğunluklu örnekleri kullanmak için bkz . Azure Batch'te İleti Geçirme Arabirimi (MPI) uygulamalarını çalıştırmak için çok örnekli görevleri kullanma.

  • Microsoft HPC Pack - HPC Pack , RDMA özellikli Linux VM'lere dağıtıldığında Azure RDMA ağını kullanan MS-MPI için bir çalışma zamanı ortamı içerir. Örneğin dağıtımlar için bkz . MPI uygulamalarını çalıştırmak için HPC Pack ile Linux RDMA kümesi ayarlama.

Dağıtma konuları

  • Azure aboneliği : İşlem yoğunluklu birkaç örnek dağıtmak için kullandıkça öde aboneliğini veya diğer satın alma seçeneklerini göz önünde bulundurun. Ücretsiz Azure hesabı kullanıyorsanız, yalnızca sınırlı sayıda Azure işlem çekirdeği kullanabilirsiniz.

  • Fiyatlandırma ve kullanılabilirlik - Azure bölgelerine göre VM fiyatlandırma ve kullanılabilirliğini denetleyin.

  • Çekirdek kotası : Azure aboneliğinizdeki çekirdek kotasını varsayılan değerden artırmanız gerekebilir. Aboneliğiniz, H serisi de dahil olmak üzere belirli VM boyutu ailelerine dağıtabileceğiniz çekirdek sayısını da sınırlayabilir. Bir kota artışı istemek için ücretsiz olarak çevrimiçi müşteri destek isteği açın. (Varsayılan sınırlar abonelik kategorinize bağlı olarak değişebilir.)

    Not

    Büyük ölçekli kapasite gereksinimleriniz varsa Azure Desteği'ne başvurun. Azure kotaları, kapasite garantisi değil kredi limitleridir. Kotanızdan bağımsız olarak yalnızca kullandığınız çekirdekler için ücretlendirilirsiniz.

  • Sanal ağ : İşlem yoğunluklu örnekleri kullanmak için Bir Azure sanal ağı gerekli değildir. Ancak, birçok dağıtım için en azından bulut tabanlı bir Azure sanal ağına veya şirket içi kaynaklara erişmeniz gerekiyorsa siteden siteye bağlantıya ihtiyacınız vardır. Gerektiğinde, örnekleri dağıtmak için yeni bir sanal ağ oluşturun. Benşim grubundaki bir sanal ağa işlem yoğunluklu VM'ler eklenmesi desteklenmez.

  • Yeniden boyutlandırma – Özelleştirilmiş donanımları nedeniyle yalnızca aynı boyut ailesinde (H serisi veya N serisi) işlem yoğunluklu örnekleri yeniden boyutlandırabilirsiniz. Örneğin, bir H serisi VM'yi yalnızca bir H serisi boyutundan diğerine yeniden boyutlandırabilirsiniz. Belirli VM'ler için InfiniBand sürücü desteği ve NVMe diskleriyle ilgili ek konuların dikkate alınması gerekebilir.

Sonraki adımlar