Az InfiniBand beállítása
Ez a cikk a CentOS-ra, egy olyan Linux-disztribúcióra hivatkozik, amely közel áll az élettartam (EOL) állapotához. Fontolja meg a használatát, és ennek megfelelően tervezze meg. További információ: CentOS End Of Life útmutató.
A következőkre vonatkozik: ✔️ Linux rendszerű virtuális gépek ✔️ Windows rendszerű virtuális gépek Rugalmas méretezési ✔️ csoportok ✔️ Egységes méretezési csoportok
Tipp.
A virtuális gépek választóeszközével megkeresheti a számítási feladatnak leginkább megfelelő méreteket.
Ez a cikk az InfiniBand (IB) hálózaton keresztül használandó RDMA-kompatibilis példányokról oszt meg néhány információt. Az InfiniBand hálózati architektúra teljes zsírfa kialakítással rendelkezik (ez egy nagy sávszélességet és alacsony késést biztosító hálózati topológia), amely biztosítja a nem blokkoló, bisectionalis szimmetriát. Ez a konfiguráció egyenlő sávszélességet biztosít az azonos virtuálisgép-méretezési csoportban (VMSS) lévő két virtuális gép (VMSS) között.
RDMA-kompatibilis példányok
A HPC virtuálisgép-méretek többsége rendelkezik hálózati adapterrel a távoli közvetlen memóriahozzáférés (RDMA) kapcsolatához. Az "r" beállítással kijelölt N-sorozatok is RDMA-kompatibilisek. Ez az interfész a többi virtuálisgép-méretben elérhető standard Azure Ethernet hálózati adapteren kívül van.
Ez a másodlagos interfész lehetővé teszi az RDMA-kompatibilis példányok számára, hogy infiniBand hálózaton keresztül kommunikáljanak, és HDR sebességgel működjenek A HBv4, HBv3, HBv2, HBv2, HBB, HC, HX, NDv2 és FDR sebességek esetén A H16r, H16mr és más RDMA-képes N sorozatú virtuális gépek esetében. Ezek az RDMA-képességek növelhetik a Message Passing Interface (MPI) alapú alkalmazások méretezhetőségét és teljesítményét.
Feljegyzés
SR-IOV-támogatás: Az Azure HPC-ben jelenleg két virtuális géposztály létezik attól függően, hogy engedélyezve vannak-e az SR-IOV az InfiniBand esetében. Az Azure-ban jelenleg szinte az összes újabb generációs, RDMA-kompatibilis vagy InfiniBand-kompatibilis virtuális gép engedélyezett a H16r, a H16mr és az NC24r kivételével. Az RDMA csak az InfiniBand hálózaton keresztül engedélyezett, és minden RDMA-kompatibilis virtuális gép esetében támogatott. Az IB-n keresztüli IP-cím csak az SR-IOV-kompatibilis virtuális gépeken támogatott. Az RDMA nincs engedélyezve az Ethernet-hálózaton keresztül.
Operációs rendszer – Gyakran használják a Linux-disztribúciókat, például CentOS, RHEL, AlmaLinux, Ubuntu, SUSE. A Windows Server 2016 és az újabb verziók minden HPC sorozatú virtuális gépen támogatottak. Vegye figyelembe, hogy a Windows Server 2012 R2 nem támogatott a HBv2-n, mivel a virtuális gépek mérete meghaladja a 64 (virtuális vagy fizikai) magot. Az Azure Marketplace-en támogatott Linux rendszerű virtuálisgép-rendszerképek listáját és azok megfelelő konfigurálásának módját a virtuálisgép-rendszerképek között találja. A megfelelő virtuálisgép-méretlapok a szoftververem támogatását is felsorolják.
InfiniBand és illesztőprogramok – Az InfiniBand-kompatibilis virtuális gépeken a megfelelő illesztőprogramok szükségesek az RDMA engedélyezéséhez. További információ az InfiniBand virtuálisgép-bővítményekről vagy az InfiniBand-illesztőprogramok manuális telepítéséről.
MPI – Az SR-IOV-kompatibilis virtuálisgép-méretek az Azure-ban szinte bármilyen MPI-verzió használatát lehetővé teszik a Mellanox OFED-hez. A HPC-hez készült MPI beállításával kapcsolatos további részletekért tekintse meg az MPI beállítását az Azure-beli HPC virtuális gépeken.
Feljegyzés
RDMA hálózati címtér: Az Azure RDMA-hálózata a 172.16.0.0/16 címteret foglalja le. Ha MPI-alkalmazásokat szeretne futtatni egy Azure-beli virtuális hálózaton üzembe helyezett példányokon, győződjön meg arról, hogy a virtuális hálózati címtér nem fedi át az RDMA-hálózatot.
Fürtkonfigurációs beállítások
Az Azure számos lehetőséget kínál olyan HPC virtuális gépek fürtjeinek létrehozására, amelyek az RDMA-hálózaton keresztül kommunikálhatnak, például:
Virtuális gépek – Az RDMA-kompatibilis HPC virtuális gépek üzembe helyezése ugyanabban a méretezési csoportban vagy rendelkezésre állási csoportban (az Azure Resource Manager üzemi modell használatakor). Ha a klasszikus üzemi modellt használja, helyezze üzembe a virtuális gépeket ugyanabban a felhőszolgáltatásban.
Virtuálisgép-méretezési csoportok – Egy virtuálisgép-méretezési csoportban győződjön meg arról, hogy az üzembe helyezést egyetlen elhelyezési csoportra korlátozza az InfiniBand-kommunikációhoz a méretezési csoportban. Egy Resource Manager-sablonban például állítsa a tulajdonságot a
singlePlacementGroup
következőretrue
: .
Vegye figyelembe, hogy a méretezési csoport maximális mérete, amellyel singlePlacementGroup=true
fel lehet pörögni, alapértelmezés szerint 100 virtuális gépen van leképezve. Ha a HPC-feladatok skálázási igényei nagyobbak, mint 100 virtuális gép egy bérlőn belül, kérhet növekedést, és ingyenesen megnyithat egy online ügyfélszolgálati kérelmet . Az egyetlen méretezési csoportban lévő virtuális gépek számának korlátja 300-ra növelhető. Vegye figyelembe, hogy a virtuális gépek rendelkezésre állási csoportok használatával történő üzembe helyezésekor a maximális korlát rendelkezésre állási csoportonként 200 virtuális gép.
Emellett a VMSS az azonos fürtben lévő számítási feladatok elkülönítési határaként szolgál, biztosítva, hogy a különböző virtuálisgép-kezelők példányai egymástól elkülönítve maradjanak a biztonság garantálása érdekében.
Feljegyzés
MPI a virtuális gépek között: Ha RDMA (például MPI-kommunikáció használata) szükséges a virtuális gépek között, győződjön meg arról, hogy a virtuális gépek ugyanabban a virtuálisgép-méretezési csoportban vagy rendelkezésre állási csoportban találhatók.
Azure CycleCloud – HPC-fürt létrehozása az Azure CycleCloud használatával MPI-feladatok futtatásához.
Azure Batch – Hozzon létre egy Azure Batch-készletet MPI-számítási feladatok futtatásához. Ha számítási igényű példányokat szeretne használni MPI-alkalmazások Azure Batch-beli futtatásakor, olvassa el a Többpéldányos feladatok használata message Passing Interface (MPI) alkalmazások azure Batchben való futtatásához című témakört.
A Microsoft HPC Pack - HPC Pack tartalmaz egy futtatókörnyezetet az MS-MPI-hez, amely az Azure RDMA-hálózatot használja RDMA-kompatibilis Linux rendszerű virtuális gépeken való üzembe helyezéskor. Például az üzembe helyezéseket lásd: Linux RDMA-fürt beállítása HPC Pack csomaggal MPI-alkalmazások futtatásához.
Telepítési szempontok
Azure-előfizetés – Ha több számítási igényű példányt szeretne üzembe helyezni, fontolja meg a használatalapú fizetéses előfizetést vagy más vásárlási lehetőségeket. Amennyiben ingyenes Azure-fiókot használ, csak korlátozott számú számítási magot használhat az Azure-ban.
Díjszabás és rendelkezésre állás – Ellenőrizze a virtuális gépek díjszabását és rendelkezésre állását az Azure-régiók szerint.
Magkvóta – Előfordulhat, hogy az Azure-előfizetés magkvóta értékét az alapértelmezett értékről kell növelnie. Az előfizetés korlátozhatja az egyes virtuálisgép-méretcsaládokban üzembe helyezhető magok számát is, beleértve a H sorozatot is. Ha kérni szeretné a kvóta növelését, hozzon létre egy ingyenes támogatási kérést az interneten. (Az alapértelmezett korlátok az előfizetés kategóriájától függően változhatnak.)
Feljegyzés
Ha nagy kapacitásra van szüksége, lépjen kapcsolatba az Azure ügyfélszolgálatával. Az Azure-kvóták kreditkorlátok, nem kapacitásgaranciák. A kvótától függetlenül csak a használt magokért kell fizetnie.
Virtuális hálózat – Nincs szükség Azure-beli virtuális hálózatra a nagy számítási igényű példányok használatához. Sok üzembe helyezés esetén azonban legalább felhőalapú Azure-beli virtuális hálózatra vagy helyek közötti kapcsolatra van szükség, ha helyszíni erőforrásokhoz kell hozzáférnie. Szükség esetén hozzon létre egy új virtuális hálózatot a példányok üzembe helyezéséhez. Nem támogatott a számítási igényű virtuális gépek hozzáadása egy affinitási csoportban lévő virtuális hálózathoz.
Átméretezés – A speciális hardverük miatt csak a nagy számítási igényű példányokat méretezheti át ugyanabban a méretcsaládban (H sorozat vagy N sorozat). Egy H sorozatú virtuális gépet például csak egy H sorozatú méretről egy másikra méretezhet át. Az InfiniBand illesztőprogram-támogatásával és az NVMe-lemezekkel kapcsolatos további szempontokat is figyelembe kell venni bizonyos virtuális gépek esetében.
Következő lépések
- További információ a virtuális gépek konfigurálásáról, az InfiniBand engedélyezéséről, az MPI beállításáról és az Azure-hoz készült HPC-alkalmazások optimalizálásáról a HPC számítási feladatoknál.
- Tekintse át a HBv3-sorozatok áttekintését és a HC-sorozatok áttekintését.
- Az Azure Compute Tech Community blogjaiban tájékozódhat a legújabb bejelentésekről, a HPC számítási feladatokra vonatkozó példáiról és teljesítményeredményeiről.
- A HPC-számítási feladatok futtatásának magasabb szintű architekturális nézetét az Azure nagy teljesítményű számítástechnika (HPC) című témakörben tekintheti meg.