Megosztás a következőn keresztül:


RDMA- vagy GPU-példányok használata Batch-készletekben

Bizonyos Batch-feladatok futtatásához kihasználhatja a nagy léptékű számításokhoz tervezett Azure-beli virtuálisgép-méreteket. Példa:

  • Többpéldányos MPI-számítási feladatok futtatásához válassza a HB, HC, NC vagy ND sorozatot, illetve olyan egyéb méreteket, amelyek hálózati adapterrel rendelkeznek a távoli közvetlen memória-hozzáféréshez (RDMA). Ezek a méretek egy InfiniBand-hálózathoz csatlakoznak a csomópontok közötti kommunikációhoz, ami felgyorsíthatja az MPI-alkalmazásokat.

  • CUDA-alkalmazások esetén válassza az NVIDIA Tesla grafikus processzor (GPU) kártyákat tartalmazó N sorozatú méreteket.

Ez a cikk útmutatást és példákat tartalmaz az Azure speciális méreteinek a Batch-készletekben való használatához. A specifikációkért és a háttérért lásd:

  • Nagy teljesítményű számítási virtuálisgép-méretek (Linux, Windows)

  • GPU-kompatibilis virtuálisgép-méretek (Linux, Windows)

Feljegyzés

Előfordulhat, hogy bizonyos virtuálisgép-méretek nem érhetők el azokban a régiókban, ahol a Batch-fiókokat hozza létre. Ha ellenőrizni szeretné, hogy elérhető-e a méret, tekintse meg a régiónkéntelérhető termékek és a Batch-készlet virtuálisgép-méretének kiválasztása című témakört.

Függőségek

A Batchben a nagy számítási igényű méretek RDMA- vagy GPU-képességei csak bizonyos operációs rendszerekben támogatottak. Ezeknek a virtuálisgép-méreteknek a támogatott operációs rendszerei csak a virtuális gépek létrehozásához elérhető részhalmazokat tartalmazzák. A Batch-készlet létrehozásának módjától függően előfordulhat, hogy további illesztőprogramokat vagy más szoftvereket kell telepítenie vagy konfigurálnia a csomópontokon. Az alábbi táblázatok összefoglalják ezeket a függőségeket. További részletekért tekintse meg a csatolt cikkeket. A Batch-készletek konfigurálására vonatkozó beállításokat a cikk későbbi részében találja.

Linux-készletek – Virtuális gép konfigurációja

Méret Funkció Operációs rendszerek Szükséges szoftver Készlet beállításai
H16r, H16mr
NC24r, NC24rs_v2, NC24rs_v3, ND24rs*
RDMA Ubuntu 22.04 LTS
(Azure Marketplace)
Intel MPI 5

Linux RDMA-illesztőprogramok
Csomópontok közötti kommunikáció engedélyezése, az egyidejű feladatvégrehajtás letiltása
NCv3, NDv2, NDv4, NDv5 sorozat NVIDIA Tesla GPU (sorozatonként eltérő) Ubuntu 22.04 LTS
(Azure Marketplace)
NVIDIA CUDA- vagy CUDA-eszközillesztők n/a
NVv3, NVv4, NVv5 sorozat Gyorsított vizualizációs GPU Ubuntu 22.04 LTS
(Azure Marketplace)
NVIDIA GRID-illesztőprogramok vagy AMD GPU-illesztőprogramok n/a

*AZ RDMA-kompatibilis N-sorozatok méretei közé tartoznak az NVIDIA Tesla GPU-k is

Fontos

Ez a dokumentum a Linux egy olyan kiadási verziójára hivatkozik, amely az Élettartam vége (EOL) közelében vagy végén található. Fontolja meg a frissítés aktuálisabb verzióra való frissítését.

Windows-készletek – Virtuális gép konfigurálása

Méret Funkció Operációs rendszerek Szükséges szoftver Készlet beállításai
H16r, H16mr
NC24r, NC24rs_v2, NC24rs_v3, ND24rs*
RDMA Windows Server 2016, 2012 R2 vagy
2012 (Azure Marketplace)
Microsoft MPI 2012 R2 vagy újabb, vagy
Intel MPI 5

Windows RDMA-illesztőprogramok
Csomópontok közötti kommunikáció engedélyezése, az egyidejű feladatvégrehajtás letiltása
NC, NCv2, NCv3, ND, NDv2 sorozat NVIDIA Tesla GPU (sorozatonként eltérő) Windows Server 2016 vagy
2012 R2 (Azure Marketplace)
NVIDIA CUDA- vagy CUDA-eszközillesztők n/a
NV, NVv2, NVv4 sorozat NVIDIA Tesla M60 GPU Windows Server 2016 vagy
2012 R2 (Azure Marketplace)
NVIDIA GRID-illesztőprogramok n/a

*AZ RDMA-kompatibilis N-sorozatok méretei közé tartoznak az NVIDIA Tesla GPU-k is

Windows-készletek – Cloud Services-konfiguráció

Figyelmeztetés

A Cloud Services konfigurációs készletei elavultak. Ehelyett használjon virtuálisgép-konfigurációs készleteket.

Méret Funkció Operációs rendszerek Szükséges szoftver Készlet beállításai
H16r, H16mr RDMA Windows Server 2016, 2012 R2, 2012 vagy
2008 R2 (Vendég operációsrendszer-család)
Microsoft MPI 2012 R2 vagy újabb, vagy
Intel MPI 5

Windows RDMA-illesztőprogramok
Csomópontok közötti kommunikáció engedélyezése,
egyidejű feladatvégrehajtás letiltása

Feljegyzés

Az N sorozat méretei nem támogatottak a Cloud Services konfigurációs készleteiben.

Készletkonfigurációs beállítások

Ha speciális virtuálisgép-méretet szeretne konfigurálni a Batch-készlethez, több lehetősége van a szükséges szoftverek vagy illesztőprogramok telepítésére:

Példa: NVIDIA GPU-illesztőprogramok Windows NC virtuálisgép-készleten

Ha CUDA-alkalmazásokat szeretne futtatni Windows NC-csomópontok készletén, telepítenie kell az NVIDIA GPU-illesztőprogramokat. Az alábbi mintalépések egy alkalmazáscsomagot használnak az NVIDIA GPU-illesztőprogramok telepítéséhez. Ezt a lehetőséget akkor választhatja, ha a számítási feladat egy adott GPU-illesztőprogram-verziótól függ.

  1. Töltse le a Windows Server 2016 GPU-illesztőinek telepítőcsomagjait az NVIDIA webhelyérőlpéldául a 411.82-es verzióból. Mentse a fájlt helyileg egy rövid névvel, például GPUDriverSetup.exe.
  2. Hozzon létre egy zip-fájlt a csomagból.
  3. Töltse fel a csomagot a Batch-fiókjába. A lépésekért tekintse meg az alkalmazáscsomagok útmutatóját. Adjon meg egy alkalmazásazonosítót, például a GPUDrivert és egy olyan verziót, mint a 411.82.
  4. A Batch API-k vagy az Azure Portal használatával hozzon létre egy készletet a virtuális gép konfigurációjában a kívánt számú csomóponttal és skálázással. Az alábbi táblázat mintabeállításokat mutat be az NVIDIA GPU-illesztőprogramok indítási feladattal történő csendes telepítéséhez:
Beállítás Érték
Rendszerkép típusa Marketplace (Linux/Windows)
Közzétevő MicrosoftWindowsServer
Ajánlat WindowsServer
Termékváltozat 2016-Datacenter
Csomópont mérete NC6 Standard
Alkalmazáscsomag-hivatkozások GPUDriver, 411.82-es verzió
Tevékenység indítása engedélyezve Igaz
Parancssor - cmd /c "%AZ_BATCH_APP_PACKAGE_GPUDriver#411.82%\\GPUDriverSetup.exe /s"
Felhasználói identitás – Készlet autouser, rendszergazda
Várakozás a sikerre – Igaz

Példa: NVIDIA GPU-illesztőprogramok Linux NC virtuálisgép-készleten

A CUDA-alkalmazások Linux NC-csomópontokból álló készleten való futtatásához telepítenie kell a szükséges NVIDIA Tesla GPU-illesztőprogramokat a CUDA-eszközkészletből. Az alábbi mintalépések létrehoznak és üzembe helyeznek egy egyéni Ubuntu 22.04 LTS-lemezképet a GPU-illesztőprogramokkal:

  1. Ubuntu 22.04 LTS-t futtató Azure NC-sorozatú virtuális gép üzembe helyezése. Például hozza létre a virtuális gépet az USA déli középső régiójában.
  2. Adja hozzá az NVIDIA GPU-illesztőprogramok bővítményt a virtuális géphez az Azure Portal, az Azure-előfizetéshez csatlakozó ügyfélszámítógép vagy az Azure Cloud Shell használatával. Másik lehetőségként kövesse a lépéseket a virtuális géphez való csatlakozáshoz és a CUDA-illesztőprogramok manuális telepítéséhez.
  3. Kövesse az alábbi lépéseket egy Azure Compute Gallery-rendszerkép létrehozásához a Batchhez.
  4. Hozzon létre egy Batch-fiókot egy olyan régióban, amely támogatja az NC virtuális gépeket.
  5. A Batch API-k vagy az Azure Portal használatával hozzon létre egy készletet az egyéni rendszerkép használatával, a kívánt csomópontszámmal és skálázással. Az alábbi táblázat a kép mintakészlet-beállításait mutatja be:
Beállítás Érték
Rendszerkép típusa Egyéni rendszerkép
Egyéni rendszerkép A kép neve
Csomópontügynök termékváltozata batch.node.ubuntu 22.04
Csomópont mérete NC6 Standard

Példa: Microsoft MPI Windows H16r virtuálisgép-készleten

A Windows MPI-alkalmazások Azure H16r virtuálisgép-csomópontok készletén való futtatásához konfigurálnia kell a HpcVmDrivers bővítményt, és telepítenie kell a Microsoft MPI-t. Az alábbi mintalépések segítségével üzembe helyezhet egy egyéni Windows Server 2016-rendszerképet a szükséges illesztőprogramokkal és szoftverekkel:

  1. Windows Server 2016 rendszerű Azure H16r rendszerű virtuális gép üzembe helyezése. Például hozza létre a virtuális gépet az USA nyugati régiójában.
  2. Adja hozzá a HpcVmDrivers bővítményt a virtuális géphez egy Azure PowerShell-parancs futtatásával az Azure-előfizetéshez csatlakozó ügyfélszámítógépről vagy az Azure Cloud Shell használatával.
  3. Hozzon létre távoli asztali kapcsolatot a virtuális géppel.
  4. Töltse le a telepítőcsomagot (MSMpiSetup.exe) a Microsoft MPI legújabb verziójához, és telepítse a Microsoft MPI-t.
  5. Kövesse az alábbi lépéseket egy Azure Compute Gallery-rendszerkép létrehozásához a Batchhez.
  6. A Batch API-k vagy az Azure Portal használatával hozzon létre egy készletet az Azure Compute Gallery használatával, a kívánt számú csomóponttal és skálázással. Az alábbi táblázat a kép mintakészlet-beállításait mutatja be:
Beállítás Érték
Rendszerkép típusa Egyéni rendszerkép
Egyéni rendszerkép A kép neve
Csomópontügynök termékváltozata batch.node.windows amd64
Csomópont mérete H16r Standard
A csomópontok közötti kommunikáció engedélyezve van Igaz
Csomópontonkénti tevékenységek maximális száma 0

Következő lépések