Databricks Runtime 9.0 gépi tanuláshoz (EoS)
Feljegyzés
A Databricks Runtime-verzió támogatása véget ért. A támogatás megszűnésének dátumáról lásd a támogatási előzményeket. A támogatott Databricks Runtime-verziókról és azok kompatibilitásáról lásd a Databricks Runtime kiadási megjegyzéseit és verzió-kompatibilitását.
A Databricks 2021 augusztusában adta ki ezt a verziót.
A Databricks Runtime 9.0 for Machine Learning használatra kész környezetet biztosít a gépi tanuláshoz és az adatelemzéshez a Databricks Runtime 9.0 (EoS) alapján. A Databricks Runtime ML számos népszerű gépi tanulási kódtárat tartalmaz, köztük a TensorFlow-t, a PyTorch-ot és az XGBoost-t. Emellett támogatja az elosztott mélytanulási képzést a Horovod használatával.
További információkért, beleértve a Databricks Runtime ML-fürt létrehozásának utasításait, lásd: AI és gépi tanulás a Databricks-en.
Helyesbítés
A kiadási megjegyzések egy korábbi verziója azt állította, hogy a fürt GPU-metrikáinak Gangliával való monitorozásának támogatása le lett tiltva a Databricks Runtime 9.0 ML GPU-ban. Ez igaz volt a Databricks Runtime 9.0 ML bétaverzióra, de a problémát kijavítottuk a Databricks Runtime 9.0 ML GA-val. A nyilatkozat eltávolították.
Új funkciók és fejlesztések
A Databricks Runtime 9.0 ML a Databricks Runtime 9.0-ra épül. A Databricks Runtime 9.0 újdonságairól, beleértve az Apache Spark MLlib és a SparkR újdonságait, tekintse meg a Databricks Runtime 9.0 (EoS) kibocsátási megjegyzéseit.
Databricks autologging (nyilvános előzetes verzió)
A Databricks Autologging mostantól elérhető a Databricks Runtime 9.0 for Machine Learninghez bizonyos régiókban. A Databricks Autologging egy kód nélküli megoldás, amely automatikus kísérletkövetést biztosít az Azure Databricks gépi tanulási betanítási munkameneteihez. A Databricks autologging funkciójával a modellparaméterek, a metrikák, a fájlok és az életút adatai automatikusan rögzítésre kerülnek, amikor modelleket tanít be számos népszerű gépi tanulási kódtárból. A betanítási munkamenetek MLflow-nyomkövetési futtatásokként vannak rögzítve. A modellfájlok is nyomon követhetők, így egyszerűen naplózhatja őket az MLflow modellregisztrációs adatbázisában, és valós idejű pontozás céljából üzembe helyezheti őket az MLflow modellkiszolgálóval.
További információért a Databricks Autologging-ról, lásd: Databricks Autologging.
A Databricks szolgáltatástároló fejlesztései
A betanítási csoportok létrehozásakor a teljesítmény javult a forrásfunkció-táblák közötti illesztések számának minimalizálásával.
Az XGBoost és a PySpark integrációja mostantól támogatja az elosztott betanítási és GPU-fürtöket
További információ: Az XGBoost használata az Azure Databricksben.
A Databricks Runtime ML Python-környezetének főbb változásai
A Conda-környezetek és a %conda parancs el lesz távolítva. A Databricks Runtime 9.0 ML a pip
és virtualenv
-vel van építve.
A Conda-alapú környezeteket használó egyéni rendszerképek a Databricks Container Services szolgáltatással továbbra is támogatottak lesznek, de nem fognak rendelkezni jegyzetfüzet-hatókörű könyvtár-képességekkel. A Databricks azt javasolja, hogy használjon virtualenv-alapú környezeteket a Databricks Container Services és %pip
szolgáltatással az összes jegyzetfüzetre korlátozott kódtárhoz.
A Databricks Runtime Python-környezet főbb változásait a Databricks Runtime 9.0 (EoS) című témakörben találhatja meg. A telepített Python-csomagok és azok verzióinak teljes listáját a Python-könyvtáraktartalmazza.
Python-csomagok frissítve
- mlflow 1.18.0 -> 1.19.0
- nltk 3.5 –> 3.6.1
Python-csomagok hozzáadva
- próféta 1.0.1
Python-csomagok el lettek távolítva
- MKL
- azure-core
- azure-storage-blob
- msrest
- docker
- lekérdezési lánc elemző
- intel-openmp
Elavulások és nem támogatott funkciók
- A Databricks Runtime 9.0 ML-ben a HorovodRunner nem támogatja a
np=0
beállítását, aholnp
a Horovod-feladathoz használandó párhuzamos folyamatok száma. - A Databricks Runtime 9.0 ML tartalmazza az r-base 4.1.0-t az R grafikus motor 14-es verziójával. Ezt az RStudio Server 1.2.x-es verziója nem támogatja.
-
nvprof
a Databricks Runtime 9.0 ML GPU-ban törlődik.
Rendszerkörnyezet
A Databricks Runtime 9.0 ML rendszerkörnyezete az alábbiak szerint különbözik a Databricks Runtime 9.0-tól:
-
DBUtils: A Databricks Runtime ML nem tartalmazza a Library segédprogramot (dbutils.library) (örökölt).
Inkább használjon
%pip
parancsokat. Lásd: Jegyzetfüzet-hatókörön belüli Python-kódtárak. - GPU-fürtök esetén a Databricks Runtime ML a következő NVIDIA GPU-kódtárakat tartalmazza:
- CUDA 11.0
- cuDNN 8.1.0.77
- NCCL 2.10.3
- TensorRT 7.2.2
Könyvtárak
Az alábbi szakaszok a Databricks Runtime 9.0 ML-ben található kódtárakat sorolják fel, amelyek eltérnek a Databricks Runtime 9.0-ban szereplő kódtáraktól.
Ebben a szakaszban:
Felső szintű kódtárak
A Databricks Runtime 9.0 ML a következő legfelső szintű kódtárakat tartalmazza:
- GraphFrames
- Horovod és HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
Python-kódtárak
A Databricks Runtime 9.0 ML a Virtualenv-t használja a Python-csomagkezeléshez, és számos népszerű ML-csomagot tartalmaz.
A következő szakaszokban megadott csomagok mellett a Databricks Runtime 9.0 ML a következő csomagokat is tartalmazza:
- hyperopt 0.2.5.db2
- sparkdl 2.2.0_db1
- feature_store 0.3.3
- automl 1.1.1
Python könyvtárak processzorfürtökön
Könyvtár | Verzió | Könyvtár | Verzió | Könyvtár | Verzió |
---|---|---|---|---|---|
absl-py | 0.11.0 | Antergos Linux | 2015.10 (ISO-frissítés) | appdirs | 1.4.4 |
argon2-cffi | 20.1.0 | Astor | 0.8.1 | astunparse | 1.6.3 |
aszinkron generátor | 1.10 | attribútumok | 20.3.0 | visszahívás | 0.2.0 |
bcrypt | 3.2.0 | fehérítő | 3.3.0 | boto3 | 1.16.7 |
botocore | 1.19.7 | Szűk keresztmetszet | 1.3.2 | cachetools | 4.2.2 |
minősítés | 2020.12.5 | cffi | 1.14.5 | chardet | 4.0.0 |
kattintás | 7.1.2 | cloudpickle | 1.6.0 | cmdstanpy | 0.9.68 |
configparser | 5.0.1 | convertdate | 2.3.2 | kriptográfia | 3.4.7 |
biciklista | 0.10.0 | Cython | 0.29.23 | databricks-cli | 0.14.3 |
dbus-python | 1.2.16 | lakberendező | 5.0.6 | defusedxml | 0.7.1 |
kapor | 0.3.2 | diskcache | 5.2.1 | distlib | 0.3.2 |
distro-info | 0,23ubuntu1 | belépési pontok | 0.3 | ephem | 4.0.0.2 |
aspektusok áttekintése | 1.0.0 | fájlzárolás | 3.0.12 | Flaska | 1.1.2 |
flatbuffers | 1.12 | fsspec | 0.9.0 | jövő | 0.18.2 |
vendég | 0.4.0 | gitdb | 4.0.7 | GitPython | 3.1.12 |
google-hitelesítés | 1.22.1 | google-auth-oauthlib | 0.4.2 | google-pasta | 0.2.0 |
grpcio | 1.34.1 | gunicorn | 20.0.4 | h5py | 3.1.0 |
hijri-konverter | 2.1.3 | szünidő | 0.10.5.2 | horovod | 0.22.1 |
htmlmin | 0.1.12 | idna | 2.10 | ImageHash | 4.2.1 |
ipykernel | 5.3.4 | ipython | 7.22.0 | ipython-genutils | 0.2.0 |
ipywidgets | 7.6.4 | isodate | 0.6.0 | itsdangerous | 1.1.0 |
jedi | 0.17.2 | Jinja2 | 2.11.3 | jmespath | 0.10.0 |
joblib | 1.0.1 | joblibspark | 0.3.0 | jsonschema | 3.2.0 |
jupyter-client | 6.1.12 | jupyter-core | 4.7.1 | jupyterlab-pygments | 0.1.2 |
jupyterlab-widgetek | 1.0.1 | keras-nightly | 2.5.0.dev2021032900 | Keras-Előfeldolgozás | 1.1.2 |
kiwisolver | 1.3.1 | Koalák | 1.8.1 | koreai holdnaptár | 0.2.1 |
lightgbm | 3.1.1 | llvmlite | 0.36.0 | LunarCalendar | 0.0.9 |
Makó | 1.1.3 | Markdown | 3.3.3 | MarkupSafe | 1.1.1 |
matplotlib | 3.4.2 | missingno | 0.5.0 | elhangolni | 0.8.4 |
mleap | 0.17.0 | mlflow-skinny | 1.19.0 | multimódszer | 1.4 |
nbclient | 0.5.3 | nbconvert | 6.0.7 | nbformat | 5.1.3 |
nest-asyncio | 1.5.1 | networkx | 2,5 | nltk | 3.6.1 |
jegyzetfüzet | 6.3.0 | numba | 0.53.1 | numpy | 1.19.2 |
oauthlib | 3.1.0 | opt-einsum | 3.3.0 | csomagolás | 20.9 |
pandas | 1.2.4 | pandas-profilkészítés | 3.0.0 | pandocfilters | 1.4.3 |
paramiko | 2.7.2 | parso | 0.7.0 | Patsy | 0.5.1 |
petastorm | 0.11.1 | pexpect | 4.8.0 | phik | 0.12.0 |
pickleshare | 0.7.5 | Párna | 8.2.0 | mag | 21.0.1 |
ábrázolás | 4.14.3 | prometheus-client | 0.10.1 | prompt-toolkit | 3.0.17 |
próféta | 1.0.1 | protobuf | 3.17.2 | psutil | 5.8.0 |
psycopg2 | 2.8.5 | ptyprocess | 0.7.0 | pyarrow | 4.0.0 |
pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pycparser | 2,20 |
pydantic | 1.8.2 | Pygments | 2.8.1 | PyGObject | 3.36.0 |
PyMeeus | 0.5.11 | PyNaCl | 1.3.0 | pyodbc | 4.0.30 |
pyparsing | 2.4.7 | pyrsistent | 0.17.3 | pystan | 2.19.1.1 |
python-apt | 2.0.0+ubuntu0.20.4.6 | python-dateutil | 2.8.1 | python-editor | 1.0.4 |
pytz | 2020.5 | PyWavelets | 1.1.1 | PyYAML | 5.4.1 |
pyzmq | 20.0.0 | regex | 2021.4.4 | kérelmek | 2.25.1 |
requests-oauthlib | 1.3.0 | requests-unixsocket | 0.2.0 | Újrapróbálkozás… | 1.3.3 |
Rsa | 4.7.2 | s3transfer | 0.3.7 | scikit-learn | 0.24.1 |
scipy | 1.6.2 | tengeri | 0.11.1 | Send2Trash | 1.5.0 |
setuptools | 52.0.0 | setuptools-git | 1,2 | shap | 0.39.0 |
simplejson | 3.17.2 | hat | 1.15.0 | szeletelő | 0.0.7 |
smmap | 3.0.5 | spark-tensorflow-distributor | 0.1.0 | sqlparse | 0.4.1 |
ssh-import-id | 5.10 | statsmodels | 0.12.2 | táblázatba foglal | 0.8.7 |
összekuszálva a unicode-dal | 0.1.0 | tensorboard | 2.5.0 | tensorboard-data-server | 0.6.1 |
tensorboard-plugin-wit | 1.8.0 | tensorflow-cpu | 2.5.0 | tensorflow-estimator | 2.5.0 |
termcolor | 1.1.0 | befejezett | 0.9.4 | tesztútvonal | 0.4.4 |
threadpoolctl | 2.1.0 | fáklya | 1.9.0+cpu | torchvision | 0.10.0+cpu |
tornádó | 6.1 | tqdm | 4.59.0 | traitlets | 5.0.5 |
gépelés-bővítmények | 3.7.4.3 | ujson | 4.0.2 | felügyelet nélküli frissítések | 0,1 |
urllib3 | 1.25.11 | virtualenv | 20.4.1 | Látomások | 0.7.1 |
wcwidth | 0.2.5 | Web kódolások | 0.5.1 | websocket-client | 0.57.0 |
Werkzeug | 1.0.1 | kerék | 0.36.2 | widgetsnbextension | 3.5.1 |
becsomagolt | 1.12.1 | xgboost | 1.4.2 |
Python-könyvtárak GPU-kapacitásokon
Könyvtár | Verzió | Könyvtár | Verzió | Könyvtár | Verzió |
---|---|---|---|---|---|
absl-py | 0.11.0 | Antergos Linux | 2015.10 (ISO-gördülő) | appdirs | 1.4.4 |
argon2-cffi | 20.1.0 | Astor | 0.8.1 | astunparse | 1.6.3 |
aszinkron generátor | 1.10 | attribútumok | 20.3.0 | backcall | 0.2.0 |
bcrypt | 3.2.0 | fehérítő | 3.3.0 | boto3 | 1.16.7 |
botocore | 1.19.7 | Szűk keresztmetszet | 1.3.2 | cachetools | 4.2.2 |
hitelesít | 2020.12.5 | cffi | 1.14.5 | chardet | 4.0.0 |
kattintás | 7.1.2 | cloudpickle | 1.6.0 | cmdstanpy | 0.9.68 |
configparser | 5.0.1 | dátumkonvertálás | 2.3.2 | kriptográfia | 3.4.7 |
biciklista | 0.10.0 | Cython | 0.29.23 | databricks-cli | 0.14.3 |
dbus-python | 1.2.16 | lakberendező | 5.0.6 | defusedxml | 0.7.1 |
kapor | 0.3.2 | diskcache | 5.2.1 | distlib | 0.3.2 |
distro-info | 0,23ubuntu1 | belépési pontok | 0.3 | ephem | 4.0.0.2 |
aspektusok áttekintése | 1.0.0 | fájlzár | 3.0.12 | Flaska | 1.1.2 |
flatbuffers | 1.12 | fsspec | 0.9.0 | jövő | 0.18.2 |
vendég | 0.4.0 | gitdb | 4.0.7 | GitPython | 3.1.12 |
google-hitelesítés | 1.22.1 | google-auth-oauthlib | 0.4.2 | google-pasta | 0.2.0 |
grpcio | 1.34.1 | gunicorn | 20.0.4 | h5py | 3.1.0 |
hijri-konverter | 2.1.3 | szünidő | 0.10.5.2 | horovod | 0.22.1 |
htmlmin | 0.1.12 | idna | 2.10 | ImageHash | 4.2.1 |
ipykernel | 5.3.4 | ipython | 7.22.0 | ipython-genutils | 0.2.0 |
ipywidgets | 7.6.4 | ISO-dátum | 0.6.0 | itsdangerous | 1.1.0 |
jedi | 0.17.2 | Jinja2 | 2.11.3 | jmespath | 0.10.0 |
joblib | 1.0.1 | joblibspark | 0.3.0 | jsonschema | 3.2.0 |
jupyter-client | 6.1.12 | jupyter-core | 4.7.1 | jupyterlab-pygments | 0.1.2 |
jupyterlab-widgets | 1.0.1 | keras-nightly | 2.5.0.dev2021032900 | Keras-Előfeldolgozás | 1.1.2 |
kiwisolver | 1.3.1 | Koalák | 1.8.1 | koreai-holdnaptár | 0.2.1 |
lightgbm | 3.1.1 | llvmlite | 0.36.0 | LunarCalendar | 0.0.9 |
Makó | 1.1.3 | Markdown | 3.3.3 | MarkupSafe | 1.1.1 |
matplotlib | 3.4.2 | missingno | 0.5.0 | rosszul hangol | 0.8.4 |
mleap | 0.17.0 | mlflow-skinny | 1.19.0 | multimódszer | 1.4 |
nbclient | 0.5.3 | nbconvert | 6.0.7 | nbformat | 5.1.3 |
nest-asyncio | 1.5.1 | networkx | 2,5 | nltk | 3.6.1 |
jegyzetfüzet | 6.3.0 | numba | 0.53.1 | numpy | 1.19.2 |
oauthlib | 3.1.0 | opt-einsum | 3.3.0 | csomagolás | 20.9 |
pandas | 1.2.4 | pandas-profilkészítés | 3.0.0 | pandocfilters | 1.4.3 |
paramiko | 2.7.2 | parso | 0.7.0 | Patsy | 0.5.1 |
petastorm | 0.11.1 | pexpect | 4.8.0 | phik | 0.12.0 |
pickleshare | 0.7.5 | Párna | 8.2.0 | pip | 21.0.1 |
ábrázolás | 4.14.3 | prometheus-client | 0.11.0 | prompt-toolkit | 3.0.17 |
próféta | 1.0.1 | protobuf | 3.17.2 | psutil | 5.8.0 |
psycopg2 | 2.8.5 | ptyprocess | 0.7.0 | pyarrow | 4.0.0 |
pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pycparser | 2,20 |
pydantic | 1.8.2 | Pygments | 2.8.1 | PyGObject | 3.36.0 |
PyMeeus | 0.5.11 | PyNaCl | 1.3.0 | pyodbc | 4.0.30 |
pyparsing | 2.4.7 | pyrsistent | 0.17.3 | pystan | 2.19.1.1 |
python-apt | 2.0.0+ubuntu0.20.4.6 | python-dateutil | 2.8.1 | python-editor | 1.0.4 |
pytz | 2020.5 | PyWavelets | 1.1.1 | PyYAML | 5.4.1 |
pyzmq | 20.0.0 | regex | 2021.4.4 | kérelmek | 2.25.1 |
requests-oauthlib | 1.3.0 | requests-unixsocket | 0.2.0 | Újrapróbálkozás… | 1.3.3 |
Rsa | 4.7.2 | s3transfer | 0.3.7 | scikit-learn | 0.24.1 |
scipy | 1.6.2 | tengeri | 0.11.1 | Send2Trash | 1.5.0 |
setuptools | 52.0.0 | setuptools-git | 1,2 | shap | 0.39.0 |
simplejson | 3.17.2 | Hat | 1.15.0 | szeletelő | 0.0.7 |
smmap | 3.0.5 | spark-tensorflow-distributor | 0.1.0 | sqlparse | 0.4.1 |
ssh-import-id | 5.10 | statsmodels | 0.12.2 | táblázatba rendez | 0.8.7 |
unicode-bonyodalmakba-keveredve | 0.1.0 | tensorboard | 2.5.0 | tensorboard-data-server | 0.6.1 |
tensorboard-plugin-wit | 1.8.0 | tensorflow | 2.5.0 | tensorflow-estimator | 2.5.0 |
termcolor | 1.1.0 | befejezve | 0.9.4 | tesztútvonal | 0.4.4 |
threadpoolctl | 2.1.0 | fáklya | 1.9.0+cu111 | torchvision | 0.10.0+cu111 |
tornádó | 6.1 | tqdm | 4.59.0 | traitlets | 5.0.5 |
gépelés-bővítmények | 3.7.4.3 | ujson | 4.0.2 | felügyelet nélküli frissítések | 0,1 |
urllib3 | 1.25.11 | virtualenv | 20.4.1 | Látomások | 0.7.1 |
wcwidth | 0.2.5 | webencodings | 0.5.1 | websocket-client | 0.57.0 |
Werkzeug | 1.0.1 | kerék | 0.36.2 | widgetsnbextension | 3.5.1 |
bebugyolált | 1.12.1 | xgboost | 1.4.2 |
Python-modulokat tartalmazó Spark-csomagok
Spark-csomag | Python-modul | Verzió |
---|---|---|
graphframes | graphframes | 0.8.1-db3-spark3.1 |
R-kódtárak
Az R-kódtárak megegyeznek a Databricks Runtime 9.0 R-kódtáraival .
Java- és Scala-könyvtárak (Scala 2.12-klaszter)
A Databricks Runtime 9.0 Java- és Scala-kódtárai mellett a Databricks Runtime 9.0 ML a következő JAR-eket tartalmazza:
CPU-klaszterek
Csoportazonosító | Artefaktum azonosítója | Verzió |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.17.0-4882dc3 |
ml.dmlc | xgboost4j-spark_2.12 | 1.4.1 |
ml.dmlc | xgboost4j_2.12 | 1.4.1 |
org.graphframes | graphframes_2.12 | 0.8.1-db2-spark3.1 |
org.mlflow | mlflow-client | 1.19.0 |
org.mlflow | mlflow-spark | 1.19.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
GPU-fürtök
Csoportazonosító | Artefaktum azonosítója | Verzió |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | 0.17.0-4882dc3 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.4.1 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.4.1 |
org.graphframes | graphframes_2.12 | 0.8.1-db2-spark3.1 |
org.mlflow | mlflow-client | 1.19.0 |
org.mlflow | mlflow-spark | 1.19.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |