RDMA- vagy GPU-példányok használata Batch-készletekben
Bizonyos Batch-feladatok futtatásához kihasználhatja a nagy léptékű számításokhoz tervezett Azure-beli virtuálisgép-méreteket. Példa:
Többpéldányos MPI-számítási feladatok futtatásához válassza a HB, HC, NC vagy ND sorozatot, illetve olyan egyéb méreteket, amelyek hálózati adapterrel rendelkeznek a távoli közvetlen memória-hozzáféréshez (RDMA). Ezek a méretek egy InfiniBand-hálózathoz csatlakoznak a csomópontok közötti kommunikációhoz, ami felgyorsíthatja az MPI-alkalmazásokat.
CUDA-alkalmazások esetén válassza az NVIDIA Tesla grafikus processzor (GPU) kártyákat tartalmazó N sorozatú méreteket.
Ez a cikk útmutatást és példákat tartalmaz az Azure speciális méreteinek a Batch-készletekben való használatához. A specifikációkért és a háttérért lásd:
Feljegyzés
Előfordulhat, hogy bizonyos virtuálisgép-méretek nem érhetők el azokban a régiókban, ahol a Batch-fiókokat hozza létre. Ha ellenőrizni szeretné, hogy elérhető-e a méret, tekintse meg a régiónkéntelérhető termékek és a Batch-készlet virtuálisgép-méretének kiválasztása című témakört.
Függőségek
A Batchben a nagy számítási igényű méretek RDMA- vagy GPU-képességei csak bizonyos operációs rendszerekben támogatottak. Ezeknek a virtuálisgép-méreteknek a támogatott operációs rendszerei csak a virtuális gépek létrehozásához elérhető részhalmazokat tartalmazzák. A Batch-készlet létrehozásának módjától függően előfordulhat, hogy további illesztőprogramokat vagy más szoftvereket kell telepítenie vagy konfigurálnia a csomópontokon. Az alábbi táblázatok összefoglalják ezeket a függőségeket. További részletekért tekintse meg a csatolt cikkeket. A Batch-készletek konfigurálására vonatkozó beállításokat a cikk későbbi részében találja.
Linux-készletek – Virtuális gép konfigurációja
Méret | Funkció | Operációs rendszerek | Szükséges szoftver | Készlet beállításai |
---|---|---|---|---|
H16r, H16mr NC24r, NC24rs_v2, NC24rs_v3, ND24rs* |
RDMA | Ubuntu 22.04 LTS (Azure Marketplace) |
Intel MPI 5 Linux RDMA-illesztőprogramok |
Csomópontok közötti kommunikáció engedélyezése, az egyidejű feladatvégrehajtás letiltása |
NCv3, NDv2, NDv4, NDv5 sorozat | NVIDIA Tesla GPU (sorozatonként eltérő) | Ubuntu 22.04 LTS (Azure Marketplace) |
NVIDIA CUDA- vagy CUDA-eszközillesztők | n/a |
NVv3, NVv4, NVv5 sorozat | Gyorsított vizualizációs GPU | Ubuntu 22.04 LTS (Azure Marketplace) |
NVIDIA GRID-illesztőprogramok vagy AMD GPU-illesztőprogramok | n/a |
*AZ RDMA-kompatibilis N-sorozatok méretei közé tartoznak az NVIDIA Tesla GPU-k is
Fontos
Ez a dokumentum a Linux egy olyan kiadási verziójára hivatkozik, amely az Élettartam vége (EOL) közelében vagy végén található. Fontolja meg a frissítés aktuálisabb verzióra való frissítését.
Windows-készletek – Virtuális gép konfigurálása
Méret | Funkció | Operációs rendszerek | Szükséges szoftver | Készlet beállításai |
---|---|---|---|---|
H16r, H16mr NC24r, NC24rs_v2, NC24rs_v3, ND24rs* |
RDMA | Windows Server 2016, 2012 R2 vagy 2012 (Azure Marketplace) |
Microsoft MPI 2012 R2 vagy újabb, vagy Intel MPI 5 Windows RDMA-illesztőprogramok |
Csomópontok közötti kommunikáció engedélyezése, az egyidejű feladatvégrehajtás letiltása |
NC, NCv2, NCv3, ND, NDv2 sorozat | NVIDIA Tesla GPU (sorozatonként eltérő) | Windows Server 2016 vagy 2012 R2 (Azure Marketplace) |
NVIDIA CUDA- vagy CUDA-eszközillesztők | n/a |
NV, NVv2, NVv4 sorozat | NVIDIA Tesla M60 GPU | Windows Server 2016 vagy 2012 R2 (Azure Marketplace) |
NVIDIA GRID-illesztőprogramok | n/a |
*AZ RDMA-kompatibilis N-sorozatok méretei közé tartoznak az NVIDIA Tesla GPU-k is
Windows-készletek – Cloud Services-konfiguráció
Figyelmeztetés
A Cloud Services konfigurációs készletei elavultak. Ehelyett használjon virtuálisgép-konfigurációs készleteket.
Méret | Funkció | Operációs rendszerek | Szükséges szoftver | Készlet beállításai |
---|---|---|---|---|
H16r, H16mr | RDMA | Windows Server 2016, 2012 R2, 2012 vagy 2008 R2 (Vendég operációsrendszer-család) |
Microsoft MPI 2012 R2 vagy újabb, vagy Intel MPI 5 Windows RDMA-illesztőprogramok |
Csomópontok közötti kommunikáció engedélyezése, egyidejű feladatvégrehajtás letiltása |
Feljegyzés
Az N sorozat méretei nem támogatottak a Cloud Services konfigurációs készleteiben.
Készletkonfigurációs beállítások
Ha speciális virtuálisgép-méretet szeretne konfigurálni a Batch-készlethez, több lehetősége van a szükséges szoftverek vagy illesztőprogramok telepítésére:
A virtuális gép konfigurációjában lévő készletekhez válasszon egy előre konfigurált Azure Marketplace-beli virtuálisgép-rendszerképet, amelyen előre telepítve vannak az illesztőprogramok és a szoftverek. Példák:
Adattudomány Linux vagy Windows rendszerű virtuális gép – nvidia CUDA-illesztőprogramokat is tartalmaz
Linux-rendszerképek a Batch-tároló számítási feladataihoz, amelyek GPU- és RDMA-illesztőprogramokat is tartalmaznak:
Ubuntu Server (GPU- és RDMA-illesztőprogramokkal) azure Batch-tárolókészletekhez
Hozzon létre egy egyéni Windows vagy Linux rendszerű virtuálisgép-lemezképet a virtuális gép méretéhez szükséges telepített illesztőprogramokkal, szoftverekkel vagy egyéb beállításokkal.
Telepítse a GPU- és RDMA-illesztőprogramokat virtuálisgép-bővítmények alapján.
Batch-alkalmazáscsomag létrehozása tömörített illesztőprogramból vagy alkalmazástelepítőből. Ezután konfigurálja a Batchet a csomag készletcsomópontokon való üzembe helyezésére, majd az egyes csomópontok létrehozásakor egyszer telepítse. Ha például az alkalmazáscsomag telepítő, hozzon létre egy indítási feladat parancssort az alkalmazás csendes telepítéséhez az összes készletcsomóponton. Érdemes lehet alkalmazáscsomagot és készletindítási feladatot használni, ha a számítási feladat egy adott illesztőprogram-verziótól függ.
Feljegyzés
A kezdő tevékenységnek rendszergazdai jogosultsággal kell futnia, és várnia kell a sikerre. A hosszan futó tevékenységek növelik a Batch-készlet kiépítésének idejét.
Példa: NVIDIA GPU-illesztőprogramok Windows NC virtuálisgép-készleten
Ha CUDA-alkalmazásokat szeretne futtatni Windows NC-csomópontok készletén, telepítenie kell az NVIDIA GPU-illesztőprogramokat. Az alábbi mintalépések egy alkalmazáscsomagot használnak az NVIDIA GPU-illesztőprogramok telepítéséhez. Ezt a lehetőséget akkor választhatja, ha a számítási feladat egy adott GPU-illesztőprogram-verziótól függ.
- Töltse le a Windows Server 2016 GPU-illesztőinek telepítőcsomagjait az NVIDIA webhelyéről – például a 411.82-es verzióból. Mentse a fájlt helyileg egy rövid névvel, például GPUDriverSetup.exe.
- Hozzon létre egy zip-fájlt a csomagból.
- Töltse fel a csomagot a Batch-fiókjába. A lépésekért tekintse meg az alkalmazáscsomagok útmutatóját. Adjon meg egy alkalmazásazonosítót, például a GPUDrivert és egy olyan verziót, mint a 411.82.
- A Batch API-k vagy az Azure Portal használatával hozzon létre egy készletet a virtuális gép konfigurációjában a kívánt számú csomóponttal és skálázással. Az alábbi táblázat mintabeállításokat mutat be az NVIDIA GPU-illesztőprogramok indítási feladattal történő csendes telepítéséhez:
Beállítás | Érték |
---|---|
Rendszerkép típusa | Marketplace (Linux/Windows) |
Közzétevő | MicrosoftWindowsServer |
Ajánlat | WindowsServer |
Termékváltozat | 2016-Datacenter |
Csomópont mérete | NC6 Standard |
Alkalmazáscsomag-hivatkozások | GPUDriver, 411.82-es verzió |
Tevékenység indítása engedélyezve | Igaz Parancssor - cmd /c "%AZ_BATCH_APP_PACKAGE_GPUDriver#411.82%\\GPUDriverSetup.exe /s" Felhasználói identitás – Készlet autouser, rendszergazda Várakozás a sikerre – Igaz |
Példa: NVIDIA GPU-illesztőprogramok Linux NC virtuálisgép-készleten
A CUDA-alkalmazások Linux NC-csomópontokból álló készleten való futtatásához telepítenie kell a szükséges NVIDIA Tesla GPU-illesztőprogramokat a CUDA-eszközkészletből. Az alábbi mintalépések létrehoznak és üzembe helyeznek egy egyéni Ubuntu 22.04 LTS-lemezképet a GPU-illesztőprogramokkal:
- Ubuntu 22.04 LTS-t futtató Azure NC-sorozatú virtuális gép üzembe helyezése. Például hozza létre a virtuális gépet az USA déli középső régiójában.
- Adja hozzá az NVIDIA GPU-illesztőprogramok bővítményt a virtuális géphez az Azure Portal, az Azure-előfizetéshez csatlakozó ügyfélszámítógép vagy az Azure Cloud Shell használatával. Másik lehetőségként kövesse a lépéseket a virtuális géphez való csatlakozáshoz és a CUDA-illesztőprogramok manuális telepítéséhez.
- Kövesse az alábbi lépéseket egy Azure Compute Gallery-rendszerkép létrehozásához a Batchhez.
- Hozzon létre egy Batch-fiókot egy olyan régióban, amely támogatja az NC virtuális gépeket.
- A Batch API-k vagy az Azure Portal használatával hozzon létre egy készletet az egyéni rendszerkép használatával, a kívánt csomópontszámmal és skálázással. Az alábbi táblázat a kép mintakészlet-beállításait mutatja be:
Beállítás | Érték |
---|---|
Rendszerkép típusa | Egyéni rendszerkép |
Egyéni rendszerkép | A kép neve |
Csomópontügynök termékváltozata | batch.node.ubuntu 22.04 |
Csomópont mérete | NC6 Standard |
Példa: Microsoft MPI Windows H16r virtuálisgép-készleten
A Windows MPI-alkalmazások Azure H16r virtuálisgép-csomópontok készletén való futtatásához konfigurálnia kell a HpcVmDrivers bővítményt, és telepítenie kell a Microsoft MPI-t. Az alábbi mintalépések segítségével üzembe helyezhet egy egyéni Windows Server 2016-rendszerképet a szükséges illesztőprogramokkal és szoftverekkel:
- Windows Server 2016 rendszerű Azure H16r rendszerű virtuális gép üzembe helyezése. Például hozza létre a virtuális gépet az USA nyugati régiójában.
- Adja hozzá a HpcVmDrivers bővítményt a virtuális géphez egy Azure PowerShell-parancs futtatásával az Azure-előfizetéshez csatlakozó ügyfélszámítógépről vagy az Azure Cloud Shell használatával.
- Hozzon létre távoli asztali kapcsolatot a virtuális géppel.
- Töltse le a telepítőcsomagot (MSMpiSetup.exe) a Microsoft MPI legújabb verziójához, és telepítse a Microsoft MPI-t.
- Kövesse az alábbi lépéseket egy Azure Compute Gallery-rendszerkép létrehozásához a Batchhez.
- A Batch API-k vagy az Azure Portal használatával hozzon létre egy készletet az Azure Compute Gallery használatával, a kívánt számú csomóponttal és skálázással. Az alábbi táblázat a kép mintakészlet-beállításait mutatja be:
Beállítás | Érték |
---|---|
Rendszerkép típusa | Egyéni rendszerkép |
Egyéni rendszerkép | A kép neve |
Csomópontügynök termékváltozata | batch.node.windows amd64 |
Csomópont mérete | H16r Standard |
A csomópontok közötti kommunikáció engedélyezve van | Igaz |
Csomópontonkénti tevékenységek maximális száma | 0 |
Következő lépések
- Ha MPI-feladatokat szeretne futtatni egy Azure Batch-készleten, tekintse meg a Windows- vagy Linux-példákat.