Megosztás a következőn keresztül:


Databricks Runtime 9.0 gépi tanuláshoz (EoS)

Feljegyzés

A Databricks Runtime-verzió támogatása véget ért. A támogatás megszűnésének dátumáról lásd a támogatási előzményeket. A támogatott Databricks Runtime-verziókról és azok kompatibilitásáról lásd a Databricks Runtime kiadási megjegyzéseit és verzió-kompatibilitását.

A Databricks 2021 augusztusában adta ki ezt a verziót.

A Databricks Runtime 9.0 for Machine Learning használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez a Databricks Runtime 9.0 (EoS) alapján. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow-t, a PyTorch-ot és az XGBoost-t. Emellett támogatja az elosztott mélytanulási képzést a Horovod használatával.

További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, lásd: AI és gépi tanulás a Databricks-en.

Helyesbítés

A kiadási megjegyzések egy korábbi verziója azt állította, hogy a fürt GPU-metrikáinak Gangliával való monitorozásának támogatása le lett tiltva a Databricks Runtime 9.0 ML GPU-ban. Ez igaz volt a Databricks Runtime 9.0 ML bétaverzióra, de a problémát kijavítottuk a Databricks Runtime 9.0 ML GA-val. A nyilatkozat eltávolították.

Új funkciók és fejlesztések

A Databricks Runtime 9.0 ML a Databricks Runtime 9.0-ra épül. A Databricks Runtime 9.0 újdonságairól, beleértve az Apache Spark MLlib és a SparkR újdonságait, tekintse meg a Databricks Runtime 9.0 (EoS) kibocsátási megjegyzéseit.

Databricks autologging (nyilvános előzetes verzió)

A Databricks Autologging mostantól elérhető a Databricks Runtime 9.0 for Machine Learninghez bizonyos régiókban. A Databricks Autologging egy kód nélküli megoldás, amely automatikus kísérletkövetést biztosít az Azure Databricks gépi tanulási betanítási munkameneteihez. A Databricks autologging funkciójával a modellparaméterek, a metrikák, a fájlok és az életút adatai automatikusan rögzítésre kerülnek, amikor modelleket tanít be számos népszerű gépi tanulási kódtárból. A betanítási munkamenetek MLflow-nyomkövetési futtatásokként vannak rögzítve. A modellfájlok is nyomon követhetők, így egyszerűen naplózhatja őket az MLflow modellregisztrációs adatbázisában, és valós idejű pontozás céljából üzembe helyezheti őket az MLflow modellkiszolgálóval.

További információért a Databricks Autologging-ról, lásd: Databricks Autologging.

A Databricks szolgáltatástároló fejlesztései

A betanítási csoportok létrehozásakor a teljesítmény javult a forrásfunkció-táblák közötti illesztések számának minimalizálásával.

Az XGBoost és a PySpark integrációja mostantól támogatja az elosztott betanítási és GPU-fürtöket

További információ: Az XGBoost használata az Azure Databricksben.

A Databricks Runtime ML Python-környezetének főbb változásai

A Conda-környezetek és a %conda parancs el lesz távolítva. A Databricks Runtime 9.0 ML a pip és virtualenv-vel van építve. A Conda-alapú környezeteket használó egyéni rendszerképek a Databricks Container Services szolgáltatással továbbra is támogatottak lesznek, de nem fognak rendelkezni jegyzetfüzet-hatókörű könyvtár-képességekkel. A Databricks azt javasolja, hogy használjon virtualenv-alapú környezeteket a Databricks Container Services és %pip szolgáltatással az összes jegyzetfüzetre korlátozott kódtárhoz.

A Databricks Runtime Python-környezet főbb változásait a Databricks Runtime 9.0 (EoS) című témakörben találhatja meg. A telepített Python-csomagok és azok verzióinak teljes listáját a Python-könyvtáraktartalmazza.

Python-csomagok frissítve

  • mlflow 1.18.0 -> 1.19.0
  • nltk 3.5 –> 3.6.1

Python-csomagok hozzáadva

  • próféta 1.0.1

Python-csomagok el lettek távolítva

  • MKL
  • azure-core
  • azure-storage-blob
  • msrest
  • docker
  • lekérdezési lánc elemző
  • intel-openmp

Elavulások és nem támogatott funkciók

  • A Databricks Runtime 9.0 ML-ben a HorovodRunner nem támogatja a np=0beállítását, ahol np a Horovod-feladathoz használandó párhuzamos folyamatok száma.
  • A Databricks Runtime 9.0 ML tartalmazza az r-base 4.1.0-t az R grafikus motor 14-es verziójával. Ezt az RStudio Server 1.2.x-es verziója nem támogatja.
  • nvprof a Databricks Runtime 9.0 ML GPU-ban törlődik.

Rendszerkörnyezet

A Databricks Runtime 9.0 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 9.0-tól:

Könyvtárak

Az alábbi szakaszok a Databricks Runtime 9.0 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 9.0-ban szereplő kódtáraktól.

Ebben a szakaszban:

Felső szintű kódtárak

A Databricks Runtime 9.0 ML a következő legfelső szintű kódtárakat tartalmazza:

Python-kódtárak

A Databricks Runtime 9.0 ML a Virtualenv-t használja a Python-csomagkezeléshez, és számos népszerű ML-csomagot tartalmaz.

A következő szakaszokban megadott csomagok mellett a Databricks Runtime 9.0 ML a következő csomagokat is tartalmazza:

  • hyperopt 0.2.5.db2
  • sparkdl 2.2.0_db1
  • feature_store 0.3.3
  • automl 1.1.1

Python könyvtárak processzorfürtökön

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.11.0 Antergos Linux 2015.10 (ISO-frissítés) appdirs 1.4.4
argon2-cffi 20.1.0 Astor 0.8.1 astunparse 1.6.3
aszinkron generátor 1.10 attribútumok 20.3.0 visszahívás 0.2.0
bcrypt 3.2.0 fehérítő 3.3.0 boto3 1.16.7
botocore 1.19.7 Szűk keresztmetszet 1.3.2 cachetools 4.2.2
minősítés 2020.12.5 cffi 1.14.5 chardet 4.0.0
kattintás 7.1.2 cloudpickle 1.6.0 cmdstanpy 0.9.68
configparser 5.0.1 convertdate 2.3.2 kriptográfia 3.4.7
biciklista 0.10.0 Cython 0.29.23 databricks-cli 0.14.3
dbus-python 1.2.16 lakberendező 5.0.6 defusedxml 0.7.1
kapor 0.3.2 diskcache 5.2.1 distlib 0.3.2
distro-info 0,23ubuntu1 belépési pontok 0.3 ephem 4.0.0.2
aspektusok áttekintése 1.0.0 fájlzárolás 3.0.12 Flaska 1.1.2
flatbuffers 1.12 fsspec 0.9.0 jövő 0.18.2
vendég 0.4.0 gitdb 4.0.7 GitPython 3.1.12
google-hitelesítés 1.22.1 google-auth-oauthlib 0.4.2 google-pasta 0.2.0
grpcio 1.34.1 gunicorn 20.0.4 h5py 3.1.0
hijri-konverter 2.1.3 szünidő 0.10.5.2 horovod 0.22.1
htmlmin 0.1.12 idna 2.10 ImageHash 4.2.1
ipykernel 5.3.4 ipython 7.22.0 ipython-genutils 0.2.0
ipywidgets 7.6.4 isodate 0.6.0 itsdangerous 1.1.0
jedi 0.17.2 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.0.1 joblibspark 0.3.0 jsonschema 3.2.0
jupyter-client 6.1.12 jupyter-core 4.7.1 jupyterlab-pygments 0.1.2
jupyterlab-widgetek 1.0.1 keras-nightly 2.5.0.dev2021032900 Keras-Előfeldolgozás 1.1.2
kiwisolver 1.3.1 Koalák 1.8.1 koreai holdnaptár 0.2.1
lightgbm 3.1.1 llvmlite 0.36.0 LunarCalendar 0.0.9
Makó 1.1.3 Markdown 3.3.3 MarkupSafe 1.1.1
matplotlib 3.4.2 missingno 0.5.0 elhangolni 0.8.4
mleap 0.17.0 mlflow-skinny 1.19.0 multimódszer 1.4
nbclient 0.5.3 nbconvert 6.0.7 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2,5 nltk 3.6.1
jegyzetfüzet 6.3.0 numba 0.53.1 numpy 1.19.2
oauthlib 3.1.0 opt-einsum 3.3.0 csomagolás 20.9
pandas 1.2.4 pandas-profilkészítés 3.0.0 pandocfilters 1.4.3
paramiko 2.7.2 parso 0.7.0 Patsy 0.5.1
petastorm 0.11.1 pexpect 4.8.0 phik 0.12.0
pickleshare 0.7.5 Párna 8.2.0 mag 21.0.1
ábrázolás 4.14.3 prometheus-client 0.10.1 prompt-toolkit 3.0.17
próféta 1.0.1 protobuf 3.17.2 psutil 5.8.0
psycopg2 2.8.5 ptyprocess 0.7.0 pyarrow 4.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pycparser 2,20
pydantic 1.8.2 Pygments 2.8.1 PyGObject 3.36.0
PyMeeus 0.5.11 PyNaCl 1.3.0 pyodbc 4.0.30
pyparsing 2.4.7 pyrsistent 0.17.3 pystan 2.19.1.1
python-apt 2.0.0+ubuntu0.20.4.6 python-dateutil 2.8.1 python-editor 1.0.4
pytz 2020.5 PyWavelets 1.1.1 PyYAML 5.4.1
pyzmq 20.0.0 regex 2021.4.4 kérelmek 2.25.1
requests-oauthlib 1.3.0 requests-unixsocket 0.2.0 Újrapróbálkozás… 1.3.3
Rsa 4.7.2 s3transfer 0.3.7 scikit-learn 0.24.1
scipy 1.6.2 tengeri 0.11.1 Send2Trash 1.5.0
setuptools 52.0.0 setuptools-git 1,2 shap 0.39.0
simplejson 3.17.2 hat 1.15.0 szeletelő 0.0.7
smmap 3.0.5 spark-tensorflow-distributor 0.1.0 sqlparse 0.4.1
ssh-import-id 5.10 statsmodels 0.12.2 táblázatba foglal 0.8.7
összekuszálva a unicode-dal 0.1.0 tensorboard 2.5.0 tensorboard-data-server 0.6.1
tensorboard-plugin-wit 1.8.0 tensorflow-cpu 2.5.0 tensorflow-estimator 2.5.0
termcolor 1.1.0 befejezett 0.9.4 tesztútvonal 0.4.4
threadpoolctl 2.1.0 fáklya 1.9.0+cpu torchvision 0.10.0+cpu
tornádó 6.1 tqdm 4.59.0 traitlets 5.0.5
gépelés-bővítmények 3.7.4.3 ujson 4.0.2 felügyelet nélküli frissítések 0,1
urllib3 1.25.11 virtualenv 20.4.1 Látomások 0.7.1
wcwidth 0.2.5 Web kódolások 0.5.1 websocket-client 0.57.0
Werkzeug 1.0.1 kerék 0.36.2 widgetsnbextension 3.5.1
becsomagolt 1.12.1 xgboost 1.4.2

Python-könyvtárak GPU-kapacitásokon

Könyvtár Verzió Könyvtár Verzió Könyvtár Verzió
absl-py 0.11.0 Antergos Linux 2015.10 (ISO-gördülő) appdirs 1.4.4
argon2-cffi 20.1.0 Astor 0.8.1 astunparse 1.6.3
aszinkron generátor 1.10 attribútumok 20.3.0 backcall 0.2.0
bcrypt 3.2.0 fehérítő 3.3.0 boto3 1.16.7
botocore 1.19.7 Szűk keresztmetszet 1.3.2 cachetools 4.2.2
hitelesít 2020.12.5 cffi 1.14.5 chardet 4.0.0
kattintás 7.1.2 cloudpickle 1.6.0 cmdstanpy 0.9.68
configparser 5.0.1 dátumkonvertálás 2.3.2 kriptográfia 3.4.7
biciklista 0.10.0 Cython 0.29.23 databricks-cli 0.14.3
dbus-python 1.2.16 lakberendező 5.0.6 defusedxml 0.7.1
kapor 0.3.2 diskcache 5.2.1 distlib 0.3.2
distro-info 0,23ubuntu1 belépési pontok 0.3 ephem 4.0.0.2
aspektusok áttekintése 1.0.0 fájlzár 3.0.12 Flaska 1.1.2
flatbuffers 1.12 fsspec 0.9.0 jövő 0.18.2
vendég 0.4.0 gitdb 4.0.7 GitPython 3.1.12
google-hitelesítés 1.22.1 google-auth-oauthlib 0.4.2 google-pasta 0.2.0
grpcio 1.34.1 gunicorn 20.0.4 h5py 3.1.0
hijri-konverter 2.1.3 szünidő 0.10.5.2 horovod 0.22.1
htmlmin 0.1.12 idna 2.10 ImageHash 4.2.1
ipykernel 5.3.4 ipython 7.22.0 ipython-genutils 0.2.0
ipywidgets 7.6.4 ISO-dátum 0.6.0 itsdangerous 1.1.0
jedi 0.17.2 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.0.1 joblibspark 0.3.0 jsonschema 3.2.0
jupyter-client 6.1.12 jupyter-core 4.7.1 jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.0.1 keras-nightly 2.5.0.dev2021032900 Keras-Előfeldolgozás 1.1.2
kiwisolver 1.3.1 Koalák 1.8.1 koreai-holdnaptár 0.2.1
lightgbm 3.1.1 llvmlite 0.36.0 LunarCalendar 0.0.9
Makó 1.1.3 Markdown 3.3.3 MarkupSafe 1.1.1
matplotlib 3.4.2 missingno 0.5.0 rosszul hangol 0.8.4
mleap 0.17.0 mlflow-skinny 1.19.0 multimódszer 1.4
nbclient 0.5.3 nbconvert 6.0.7 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2,5 nltk 3.6.1
jegyzetfüzet 6.3.0 numba 0.53.1 numpy 1.19.2
oauthlib 3.1.0 opt-einsum 3.3.0 csomagolás 20.9
pandas 1.2.4 pandas-profilkészítés 3.0.0 pandocfilters 1.4.3
paramiko 2.7.2 parso 0.7.0 Patsy 0.5.1
petastorm 0.11.1 pexpect 4.8.0 phik 0.12.0
pickleshare 0.7.5 Párna 8.2.0 pip 21.0.1
ábrázolás 4.14.3 prometheus-client 0.11.0 prompt-toolkit 3.0.17
próféta 1.0.1 protobuf 3.17.2 psutil 5.8.0
psycopg2 2.8.5 ptyprocess 0.7.0 pyarrow 4.0.0
pyasn1 0.4.8 pyasn1-modules 0.2.8 pycparser 2,20
pydantic 1.8.2 Pygments 2.8.1 PyGObject 3.36.0
PyMeeus 0.5.11 PyNaCl 1.3.0 pyodbc 4.0.30
pyparsing 2.4.7 pyrsistent 0.17.3 pystan 2.19.1.1
python-apt 2.0.0+ubuntu0.20.4.6 python-dateutil 2.8.1 python-editor 1.0.4
pytz 2020.5 PyWavelets 1.1.1 PyYAML 5.4.1
pyzmq 20.0.0 regex 2021.4.4 kérelmek 2.25.1
requests-oauthlib 1.3.0 requests-unixsocket 0.2.0 Újrapróbálkozás… 1.3.3
Rsa 4.7.2 s3transfer 0.3.7 scikit-learn 0.24.1
scipy 1.6.2 tengeri 0.11.1 Send2Trash 1.5.0
setuptools 52.0.0 setuptools-git 1,2 shap 0.39.0
simplejson 3.17.2 Hat 1.15.0 szeletelő 0.0.7
smmap 3.0.5 spark-tensorflow-distributor 0.1.0 sqlparse 0.4.1
ssh-import-id 5.10 statsmodels 0.12.2 táblázatba rendez 0.8.7
unicode-bonyodalmakba-keveredve 0.1.0 tensorboard 2.5.0 tensorboard-data-server 0.6.1
tensorboard-plugin-wit 1.8.0 tensorflow 2.5.0 tensorflow-estimator 2.5.0
termcolor 1.1.0 befejezve 0.9.4 tesztútvonal 0.4.4
threadpoolctl 2.1.0 fáklya 1.9.0+cu111 torchvision 0.10.0+cu111
tornádó 6.1 tqdm 4.59.0 traitlets 5.0.5
gépelés-bővítmények 3.7.4.3 ujson 4.0.2 felügyelet nélküli frissítések 0,1
urllib3 1.25.11 virtualenv 20.4.1 Látomások 0.7.1
wcwidth 0.2.5 webencodings 0.5.1 websocket-client 0.57.0
Werkzeug 1.0.1 kerék 0.36.2 widgetsnbextension 3.5.1
bebugyolált 1.12.1 xgboost 1.4.2

Python-modulokat tartalmazó Spark-csomagok

Spark-csomag Python-modul Verzió
graphframes graphframes 0.8.1-db3-spark3.1

R-kódtárak

Az R-kódtárak megegyeznek a Databricks Runtime 9.0 R-kódtáraival .

Java- és Scala-könyvtárak (Scala 2.12-klaszter)

A Databricks Runtime 9.0 Java- és Scala-kódtárai mellett a Databricks Runtime 9.0 ML a következő JAR-eket tartalmazza:

CPU-klaszterek

Csoportazonosító Artefaktum azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.17.0-4882dc3
ml.dmlc xgboost4j-spark_2.12 1.4.1
ml.dmlc xgboost4j_2.12 1.4.1
org.graphframes graphframes_2.12 0.8.1-db2-spark3.1
org.mlflow mlflow-client 1.19.0
org.mlflow mlflow-spark 1.19.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

GPU-fürtök

Csoportazonosító Artefaktum azonosítója Verzió
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 0.17.0-4882dc3
ml.dmlc xgboost4j-gpu_2.12 1.4.1
ml.dmlc xgboost4j-spark-gpu_2.12 1.4.1
org.graphframes graphframes_2.12 0.8.1-db2-spark3.1
org.mlflow mlflow-client 1.19.0
org.mlflow mlflow-spark 1.19.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0