Mi az az Azure Machine Learning számítási példány?
Az Azure Machine Learning számítási példánya egy felügyelt felhőalapú munkaállomás adatelemzők számára. Minden számítási példánynak csak egy tulajdonosa van, bár több számítási példány között is megoszthat fájlokat.
A számítási példányok megkönnyítik az Azure Machine Learning fejlesztésének első lépéseit, valamint felügyeleti és nagyvállalati felkészültségi képességeket biztosítanak az informatikai rendszergazdák számára.
Használjon számítási példányt teljes mértékben konfigurált és felügyelt fejlesztési környezetként a felhőben gépi tanuláshoz. Számítási célként is használhatók fejlesztési és tesztelési célokra való betanításhoz és következtetéshez.
A számítási példány Jupyter-funkcióinak működéséhez győződjön meg arról, hogy a webes szoftvercsatornák közötti kommunikáció nincs letiltva. Győződjön meg róla, hogy a hálózat engedélyezi a websocket-kapcsolatokat a *.instances.azureml.net és *.instances.azureml.ms címekre.
Fontos
A cikkben megjelölt (előzetes verziójú) elemek jelenleg nyilvános előzetes verzióban érhetők el. Az előzetes verzió szolgáltatásszint-szerződés nélkül érhető el, és éles számítási feladatokhoz nem ajánlott. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik. További információ: Kiegészítő használati feltételek a Microsoft Azure előzetes verziójú termékeihez.
Miért érdemes számítási példányt használni?
A számítási példány egy teljes mértékben felügyelt felhőalapú munkaállomás, amely a gépi tanulási fejlesztési környezethez van optimalizálva. A következő előnyöket nyújtja:
Fő előnyök | Leírás |
---|---|
Termelékenység | Az Azure Machine Learning Studióban integrált jegyzetfüzetek és a következő eszközök használatával hozhat létre és helyezhet üzembe modelleket: - Jupyter - JupyterLab - VS Code (előzetes verzió) A számítási példány teljes mértékben integrálva van az Azure Machine Learning-munkaterülettel és a studióval. Jegyzetfüzeteket és adatokat oszthat meg a munkaterület más adatelemzőivel. |
Felügyelt > biztonságos | Csökkentse a biztonsági lábnyomot, és adja hozzá a vállalati biztonsági követelményeknek való megfelelést. A számítási példányok robusztus felügyeleti szabályzatokat és biztonságos hálózati konfigurációkat biztosítanak, például: – Automatikus leépítés Resource Manager-sablonokból vagy Azure Machine Learning SDK-ból - Azure szerepköralapú hozzáférés-vezérlés (Azure RBAC) - Virtuális hálózatok támogatása – Azure-szabályzat az SSH-hozzáférés letiltásához – Azure-szabályzat a virtuális hálózaton való létrehozás kikényszerítéséhez - Automatikus leállítás/automatikus indítás ütemezés szerint - TLS 1.2 engedélyezve |
Gépi tanuláshoz előre konfigurálva | Az előre konfigurált és naprakész ML-csomagokkal, mélytanulási keretrendszerekkel és GPU-illesztőprogramokkal időt takaríthat meg a feladatok beállításával. |
Teljesen testre szabható | Az Azure-beli virtuálisgép-típusok, köztük a GPU-k széles körű támogatása és a tartósan alacsony szintű testreszabás, például a csomagok és illesztőprogramok telepítése megkönnyíti a speciális forgatókönyveket. A testreszabás automatizálásához beállítási szkripteket is használhat |
- A számítási példány védelme nyilvános IP-cím nélkül.
- A számítási példány a számítási fürtökhöz hasonló biztonságos betanítási számítási cél is, de egyetlen csomópont.
- Létrehozhat egy számítási példányt saját maga, vagy a rendszergazda létrehozhat egy számítási példányt az Ön nevében.
- A beállítási szkript használatával automatikusan testre szabhatja és konfigurálhatja a számítási példányt az igényeinek megfelelően.
- A költségek csökkentése érdekében hozzon létre egy ütemezést a számítási példány automatikus indításához és leállításához, vagy engedélyezze az üresjárati leállítást
Eszközök és környezetek
Az Azure Machine Learning számítási példány lehetővé teszi, hogy modelleket szerkesszen, taníts be és telepítsen egy teljesen integrált jegyzetfüzetben a munkaterületen.
Jegyzetfüzeteket futtathat az Azure Machine Learning-munkaterületről, a Jupyterből, a JupyterLabból vagy a Visual Studio Code-ból. A VS Code Desktop konfigurálható a számítási példány eléréséhez. Vagy használja a VS Code-ot a weben, közvetlenül a böngészőből, a szükséges telepítések és függőségek nélkül.
Javasoljuk, hogy próbálja ki a WEBES VS Code-ot, hogy kihasználhassa az általa biztosított egyszerű integrációs és gazdag fejlesztési környezetet. A VS Code for the Web számos olyan funkciót kínál a VS Code Desktopban, amelyet szeret, beleértve a keresés és a szintaxis kiemelését a böngészés és a szerkesztés során. A VS Code Desktop és a VS Code webes használatáról további információt az Azure Machine Learningbe integrált Visual Studio Code indítása (előzetes verzió) és a számítási példányhoz távolról csatlakoztatott VS Code-ban (előzetes verzió) című témakörben talál.
Csomagokat telepíthet, és kerneleket adhat hozzá a számítási példányhoz.
A következő eszközök és környezetek már telepítve vannak a számítási példányon:
Általános eszközök és környezetek | Részletek |
---|---|
Illesztőprogramok | CUDA cuDNN NVIDIA Blob FUSE |
Intel MPI-kódtár | |
Azure CLI | |
Azure Machine Learning-minták | |
Docker | |
Nginx | |
NCCL 2.0 | |
Protobuf |
R-eszközök és környezetek | Részletek |
---|---|
R kernel |
PYTHON-eszközök > környezetek | Részletek |
---|---|
Anaconda Python | |
Jupyter és bővítmények | |
Jupyterlab és bővítmények | |
Azure Machine Learning SDK Pythonhoz a PyPI-ból |
Tartalmazza az azure-ai-ml-t és számos gyakori Azure-extra csomagot. A teljes lista megtekintéséhez nyisson meg egy terminálablakot a számítási példányon , és futtassa conda list -n azureml_py310_sdkv2 ^azure |
Egyéb PyPI-csomagok | jupytext tensorboard nbconvert notebook Pillow |
Conda-csomagok | cython numpy ipykernel scikit-learn matplotlib tqdm joblib nodejs |
Mélytanulási csomagok | PyTorch TensorFlow Keras Horovod MLFlow pandas-ml scrapbook |
ONNX-csomagok | keras2onnx onnx onnxconverter-common skl2onnx onnxmltools |
Azure Machine Learning Python-minták |
A számítási példány alap operációs rendszere az Ubuntu.
Fájlok elérése
A jegyzetfüzeteket és a Python-szkripteket a rendszer a munkaterület alapértelmezett tárfiókjában tárolja az Azure-fájlmegosztásban. Ezek a fájlok a "Felhasználói fájlok" könyvtár alatt találhatók. Ez a tárterület megkönnyíti a jegyzetfüzetek számítási példányok közötti megosztását. A tárfiók emellett biztonságosan megőrzi a jegyzetfüzeteket, amikor leállítja vagy törli a számítási példányokat.
A munkaterület Azure-fájlmegosztási fiókja meghajtóként van csatlakoztatva a számítási példányhoz. Ez a meghajtó a Jupyter, a Jupyter Labs, az RStudio és a Posit Workbench alapértelmezett munkakönyvtára. Ez azt jelenti, hogy a Jupyter, a JupyterLab, a VS Code for Web, az RStudio vagy a Posit alkalmazásban létrehozott jegyzetfüzetek és egyéb fájlok automatikusan a fájlmegosztáson vannak tárolva, és más számítási példányokban is használhatók.
A fájlmegosztás fájljai az ugyanazon a munkaterületen található összes számítási példányból elérhetők. A számítási példányon található fájlok módosításai megbízhatóan megmaradnak a fájlmegosztásban.
A legújabb Azure Machine Learning-mintákat a munkaterület fájlmegosztás felhasználói fájlkönyvtárában lévő mappába is klónozhatja.
A kis fájlok írása a hálózati meghajtókon lassabb lehet, mint a számítási példány helyi lemezére való írás. Ha sok kis fájlt ír, próbáljon meg közvetlenül a számítási példányon könyvtárat használni, például egy könyvtárat /tmp
. A számítási példányon lévő fájlok nem érhetők el más számítási példányokról.
Ne tárolja a betanítási adatokat a jegyzetfüzetek fájlmegosztásán. Az adatok tárolásának különböző lehetőségeiről további információt az Access-adatok egy feladatban című témakörben talál.
Az ideiglenes adatok tárolásához használhatja a számítási példány /tmp
könyvtárát. Ne írjon azonban nagy adatfájlokat a számítási példány operációsrendszer-lemezére. A számítási példány operációsrendszer-lemeze 120 GB kapacitással rendelkezik. Az ideiglenes betanítási adatokat az /mnt-en csatlakoztatott ideiglenes lemezen is tárolhatja. Az ideiglenes lemez mérete a kiválasztott virtuálisgép-méreten alapul, és nagyobb mennyiségű adatot tud tárolni, ha nagyobb méretű virtuális gépet választ. A telepített szoftvercsomagokat a rendszer a számítási példány operációsrendszer-lemezére menti. Vegye figyelembe, hogy az ügyfél által felügyelt kulcstitkosítás jelenleg nem támogatott az operációsrendszer-lemezen. A számítási példányok operációsrendszer-lemezének titkosítása a Microsoft által felügyelt kulcsokkal történik.
Adattárakat és adathalmazokat is csatlakoztathat.
Létrehozás
Az alapszintű számítási példány létrehozásához kövesse az Erőforrások létrehozása című témakörben leírt lépéseket.
További lehetőségekért lásd egy új számítási példány létrehozását.
Rendszergazdaként létrehozhat egy számítási példányt a munkaterület többi tagja számára. Az egyszeri bejelentkezést le kell tiltani egy ilyen számítási példány esetében.
A számítási példány testreszabásához és konfigurálásához egy beállítási szkriptet is használhat.
Számítási példányok létrehozásának egyéb módjai:
- Közvetlenül az integrált jegyzetfüzetek felületéről.
- Az Azure Resource Manager-sablonból. Egy példasablonért tekintse meg az Azure Machine Learning számításipéldány-sablonjának létrehozását.
- Az Azure Machine Learning SDK-val
- Az Azure Machine Learning PARANCSSOR-bővítményéből
A virtuális gép családkvóta szerinti régiónkénti dedikált magok és a számítási példányok létrehozására vonatkozó teljes regionális kvóta egységes, és meg van osztva az Azure Machine Learning betanítási számítási fürtkvóval. A számítási példány leállítása nem ad ki kvótát, hogy biztosan újraindíthassa a számítási példányt. Ne állítsa le a számítási példányt az operációsrendszer-terminálon sudo leállítással.
A számítási példányhoz P10-es operációsrendszer-lemez tartozik. Az ideiglenes lemez típusa a kiválasztott virtuálisgép-mérettől függ. Az operációsrendszer-lemez típusa jelenleg nem módosítható.
Számítási cél
A számítási példányok az Azure Machine Learning számítási betanítási fürtjeihez hasonló betanítási számítási célként használhatók. A számítási példányok azonban csak egyetlen csomópontot tartalmazhatnak, míg a számítási fürtök több csomópontot is tartalmazhatnak.
Számítási példány:
- Van egy feladatsor.
- Virtuális hálózati környezetben biztonságosan futtatja a feladatokat anélkül, hogy a vállalatoknak SSH-portot kellene megnyitniuk. A feladat tárolóalapú környezetben fut, és a modell függőségeit egy Docker-tárolóba csomagolja.
- Több kis feladatot is futtathat párhuzamosan. A vCPU-nként egy feladat párhuzamosan futtatható, miközben a többi feladat várólistára kerül.
- Támogatja az egycsomópontos több GPU-s elosztott betanítási feladatokat
A számítási példányt helyi következtetéses üzembehelyezési célként használhatja tesztelési/hibakeresési forgatókönyvekhez.
Tipp.
A számítási példány 120 GB-os operációsrendszer-lemezzel rendelkezik. Ha elfogy a lemezterület, és használhatatlan állapotba kerül, törölje legalább 5 GB lemezterületét az operációsrendszer-lemezen (/ra csatlakoztatva) a számítási példány terminálján a fájlok/mappák eltávolításával, majd tegye sudo reboot
. Az ideiglenes lemezt az újraindítás után szabadítjuk fel; nem kell manuálisan törölnie a lemezterületet. A terminál eléréséhez nyissa meg a számítási lista vagy a számítási példány részleteit tartalmazó lapot, és kattintson a Terminál hivatkozásra. Ellenőrizheti a rendelkezésre álló lemezterület a(z) df -h
futtatásával a terminálon. Szabadítson fel legalább 5 GB lemezterületet a sudo reboot
végrehajtása előtt. Ne állítsa le vagy indítsa újra a számítási példányt a Studióban, amíg el nem törli az 5 GB lemezterületet. Az automatikus leállítás, beleértve az ütemezett indítást vagy leállítást, valamint az üresjárati leállítást, nem fog működni, ha a számítási példány lemeze tele van.
Kapcsolódó tartalom
- Az első lépésekhez szükséges erőforrások létrehozása.
- Oktatóanyag: Az első gépi tanulási modell betanítása bemutatja, hogyan használható számítási példány egy integrált jegyzetfüzettel.