Bagikan melalui


Databricks Runtime 11.2 untuk Pembelajaran Mesin (EoS)

Catatan

Dukungan untuk versi Databricks Runtime ini telah berakhir. Untuk tanggal akhir dukungan, lihat Riwayat akhir dukungan. Untuk semua versi Databricks Runtime yang didukung, lihat Versi dan kompatibilitas catatan rilis Databricks Runtime.

Databricks Runtime 11.2 untuk Pembelajaran Mesin menyediakan lingkungan siap pakai untuk pembelajaran mesin dan ilmu data berdasarkan Databricks Runtime 11.2 (EoS). Databricks Runtime ML berisi banyak pustaka pembelajaran mesin populer, termasuk TensorFlow, PyTorch, dan XGBoost. Databricks Runtime ML mencakup AutoML, alat untuk secara otomatis melatih alur pembelajaran mesin. Databricks Runtime ML juga mendukung pelatihan pembelajaran mendalam menggunakan Horovod.

Untuk informasi selengkapnya, termasuk instruksi untuk membuat kluster ML Runtime Databricks, lihat AI dan pembelajaran mesin di Databricks.

Fitur dan peningkatan baru

Databricks Runtime 11.2 ML dibangun di atas Databricks Runtime 11.2. Untuk informasi tentang apa yang baru di Databricks Runtime 11.2, termasuk Apache Spark MLlib dan SparkR, lihat catatan rilis Databricks Runtime 11.2 (EoS).

Penyempurnaan AutoML

AutoML sekarang memiliki dukungan yang lebih baik untuk himpunan data yang tidak seimbang untuk masalah klasifikasi. Untuk detailnya, lihat Dukungan himpunan data yang tidak seimbang untuk masalah klasifikasi.

Peningkatan ke Penyimpanan Fitur Databricks

Peningkatan berikut telah dilakukan pada Penyimpanan Fitur Databricks.

  • Untuk toko online, bidang pengguna dan kata sandi tidak digunakan lagi. Untuk menghindari ketidaksesuaian di masa mendatang, ubah semua penggunaan bidang ini menjadi write_secret_prefix.
  • Semua dokumentasi dan output dari klien penyimpanan fitur sekarang merujuk ke versi klien (misalnya, 0.6.1) alih-alih versi ML Runtime Databricks (seperti 11.2).

Lingkungan sistem

Lingkungan sistem di Databricks Runtime 11.2 ML berbeda dari Databricks Runtime 11.2 sebagai berikut:

Pustaka

Bagian berikut mencantumkan pustaka yang disertakan dalam Databricks Runtime 11.2 ML yang berbeda dari yang disertakan dalam Databricks Runtime 11.2.

Di bagian ini:

Pustaka tingkat atas

Databricks Runtime 11.2 ML menyertakan perpustakaan kelas atas berikut:

Perpustakaan Python

Databricks Runtime 11.2 ML menggunakan Virtualenv untuk manajemen paket Python dan mencakup banyak paket ML populer.

Selain paket yang ditentukan di bagian berikut, Databricks Runtime 11.2 ML juga mencakup paket berikut:

  • hyperopt 0.2.7.db1
  • sparkdl 2.2.0_db6
  • feature_store 0.6.0
  • automl 1.12.3

Pustaka Python pada kluster CPU

Untuk mereproduksi lingkungan Databricks Runtime ML Python di lingkungan virtual Python lokal Anda, unduh file requirements-11.2.txt dan jalankan pip install -r requirements-11.2.txt. Perintah ini menginstal semua pustaka sumber terbuka yang digunakan Databricks Runtime ML, tetapi tidak menginstal pustaka yang dikembangkan Azure Databricks, seperti databricks-automl, databricks-feature-store, atau fork Databricks dari hyperopt.

Perpustakaan Versi Perpustakaan Versi Perpustakaan Versi
absl-py 1.0.0 Antergos Linux 2015.10 (ISO-Bergulir) argon2-cffi 20.1.0
Astor 0.8.1 astunparse 1.6.3 generator asinkron 1.10
atribut 21.2.0 azure-core 1.22.1 azure-cosmos 4.2.0
panggilan balik 0.2.0 backports.entry-points-selectable 1.1.1 bcrypt 3.2.2
hitam 22.3.0 pemutih 4.0.0 kebahagiaan 0.7.8
boto3 1.21.18 botocore 1.24.18 cachetools 5.2.0
katalog 2.0.8 sertifikat 2021.10.8 cffi 1.14.6
chardet 4.0.0 charset-normalizer 2.0.4 klik 8.0.3
cloudpickle 2.0.0 cmdstanpy 0.9.68 configparser 5.2.0
convertdate 2.4.0 kriptografi 3.4.8 cycler 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.10
databricks-cli 0.17.0 dbl-tempo 0.1.12 dbus-python 1.2.16
debugpy 1.4.1 pendekor 5.1.0 defusedxml 0.7.1
dill 0.3.4 diskcache 5.4.0 distlib 0.3.5
distro-info 0.23ubuntu1 titik masuk 0,3 ephem 4.1.3
gambaran keseluruhan faset 1.0.0 fasttext 0.9.2 filelock 3.3.1
Flask 1.1.2 flatbuffers 1.12 fsspec 2021.8.1
masa depan 0.18.2 gast 0.4.0 gitdb 4.0.9
GitPython 3.1.27 google-autentikasi 2.6.0 google-auth-oauthlib 0.4.6
google-pasta 0.2.0 grpcio 1.44.0 gunicorn==19.9.0 20.1.0
gviz-api 1.10.0 h5py 3.3.0 hijri-converter 2.2.4
hari libur 0.14.2 Horovod 0.25.0 htmlmin 0.1.12
huggingface-hub 0.8.1 idna 3.2 ImageHash 4.2.1
imbalanced-learn 0.8.1 importlib-metadata 4.8.1 ipykernel 6.12.1
ipython 7.32.0 ipython-genutils 0.2.0 ipywidgets 7.7.0
isodate 0.6.1 itsdangerous 2.0.1 jedi 0.18.0
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.0.1
joblibspark 0.5.0 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.8.1 jupyterlab-pygments 0.1.2 jupyterlab-widgets 1.0.0
keras 2.9.0 Keras-Preprocessing 1.1.2 kiwisolver 1.3.1
kalender lunar Korea 0.2.1 langcodes 3.3.0 libclang 14.0.6
lightgbm 3.3.2 llvmlite 0.37.0 Kalender Lunar 0.0.9
Mako 1.2.0 Markdown 3.3.6 MarkupSafe 2.0.1
matplotlib 3.4.3 matplotlib-inline 0.1.2 missingno 0.5.1
mistune 0.8.4 mleap 0.20.0 mlflow-skinny 1.28.0
multimethod 1.8 murmurhash 1.0.8 ekstensi mypy 0.4.3
nbclient 0.5.3 nbconvert 6.1.0 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2.6.3 nltk 3.6.5
buku catatan 6.4.5 numba 0.54.1 numpy 1.20.3
oauthlib 3.2.0 opt-einsum 3.3.0 kemasan 21.0
pandas 1.3.4 pandas-profiling 3.1.0 pandocfilters 1.4.3
paramiko 2.9.2 parso 0.8.2 pathspec 0.9.0
-pati 0.6.2 orang yang mudah ditipu 0.5.2 petastorm 0.11.4
pexpect 4.8.0 phik 0.12.2 pickleshare 0.7.5
Bantal 8.4.0 pip 21.2.4 platformdirs 2.5.2
plotly 5.9.0 pmdarima 1.8.5 preshed 3.0.7
prometheus-client 0.11.0 prompt-toolkit 3.0.20 nabi 1.0.1
protobuf 3.19.4 psutil 5.8.0 psycopg2 2.9.3
ptyprocess 0.7.0 pyarrow 7.0.0 pyasn1 0.4.8
pyasn1-modul 0.2.8 pybind11 2.10.0 pycparser 2,20
pydantic 1.9.2 Pygments 2.10.0 PyGObject 3.36.0
PyJWT 2.4.0 PyMeeus 0.5.11 PyNaCl 1.5.0
pyodbc 4.0.31 pyparsing 3.0.4 pyrsistent 0.18.0
pystan 2.19.1.1 python-apt 2.0.0+ubuntu0.20.4.7 python-dateutil 2.8.2
python-editor 1.0.4 pytz 2021.3 PyWavelets 1.1.1
PyYAML 6.0 pyzmq 22.2.1 regex 3 Agustus 2021
permintaan 2.26.0 requests-oauthlib 1.3.1 requests-unixsocket 0.2.0
rsa 4.9 s3transfer 0.5.2 scikit-learn 0.24.2
scipy 1.7.1 seaborn 0.11.2 Send2Trash 1.8.0
setuptools 58.0.4 setuptools-git 1.2 shap 0.41.0
simplejson 3.17.6 six 1.16.0 pemotong 0.0.7
smart-open 5.2.1 smmap 5.0.0 luas 3.4.0
spacy-legacy 3.0.9 spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0
sqlparse 0.4.2 seriusan 2.4.4 ssh-import-id 5.10
statsmodels 0.12.2 menyusun 0.8.9 terjerat-dalam-unicode 0.1.0
ketekunan 8.0.1 TensorBoard 2.9.1 tensorboard-data-server 0.6.1
tensorboard-plugin-profile 2.8.0 tensorboard-plugin-wit 1.8.1 tensorflow-cpu 2.9.1
tensorflow-estimator 2.9.0 tensorflow-io-gcs-filesystem 0.26.0 termcolor 1.1.0
selesai 0.9.4 testpath 0.5.0 thinc 8.1.0
threadpoolctl 2.2.0 tokenize-rt 4.2.1 pemroses token atau pemisah kata 0.12.1
tomli 2.0.1 obor 1.11.0+cpu torchvision 0.12.0+cpu
tornado 6.1 tqdm 4.62.3 traitlets=5.0.5 5.1.0
Transformer 4.20.1 typer 0.4.2 typing-extensions 3.10.0.2
ujson 4.0.2 peningkatan otomatis 0.1 urllib3 1.26.7
virtualenv 20.8.0 visions 0.7.4 wasabi 0.10.1
wcwidth 0.2.5 webencodings=0.5.1 0.5.1 Klien WebSocket 1.3.1
Werkzeug 2.0.2 roda 0.37.0 widgetsnbextension 3.6.0
terbungkus 1.12.1 xgboost 1.5.2 zipp 3.6.0

Pustaka Phyton di kluster GPU

Perpustakaan Versi Perpustakaan Versi Perpustakaan Versi
absl-py 1.0.0 Antergos Linux 2015.10 (ISO-Rolling) argon2-cffi 20.1.0
astor 0.8.1 astunparse 1.6.3 async-generator 1.10
atribut 21.2.0 azure-core 1.22.1 azure-cosmos 4.2.0
panggilan balik 0.2.0 backports.entry-points-selectable 1.1.1 bcrypt 3.2.2
hitam 22.3.0 pemutih 4.0.0 kebahagiaan 0.7.8
boto3 1.21.18 botocore 1.24.18 cachetools 5.2.0
katalog 2.0.8 sertifikat 2021.10.8 cffi 1.14.6
chardet 4.0.0 charset-normalizer 2.0.4 klik 8.0.3
cloudpickle (perpustakaan Python untuk serialisasi objek) 2.0.0 cmdstanpy 0.9.68 configparser 5.2.0
convertdate 2.4.0 kriptografi 3.4.8 pengendara sepeda 0.10.0
cymem 2.0.6 Cython 0.29.24 databricks-automl-runtime 0.2.10
databricks-cli 0.17.0 dbl-tempo 0.1.12 dbus-python 1.2.16
debugpy 1.4.1 dekorator 5.1.0 defusedxml 0.7.1
adasku 0.3.4 diskcache 5.4.0 distlib 0.3.5
distro-info 0.23ubuntu1 titik masuk 0,3 ephem 4.1.3
ikhtisar-faset 1.0.0 fasttext 0.9.2 filelock 3.3.1
Flask 1.1.2 flatbuffers 1.12 fsspec 1 Agustus 2021
masa depan 0.18.2 gast 0.4.0 gitdb 4.0.9
GitPython 3.1.27 google-auth 2.6.0 google-auth-oauthlib 0.4.6
google-pasta 0.2.0 grpcio 1.44.0 gunicorn 20.1.0
gviz-api 1.10.0 h5py 3.3.0 hijri-converter 2.2.4
hari libur 0.14.2 Horovod 0.25.0 htmlmin 0.1.12
huggingface-hub (platform kolaborasi untuk pembelajaran mesin) 0.8.1 idna 3.2 ImageHash 4.2.1
pembelajaran data tidak seimbang 0.8.1 importlib-metadata 4.8.1 ipykernel 6.12.1
ipython 7.32.0 ipython-genutils 0.2.0 ipywidgets 7.7.0
isodate 0.6.1 itsdangerous 2.0.1 jedi 0.18.0
Jinja2 2.11.3 jmespath 0.10.0 joblib 1.0.1
joblibspark 0.5.0 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.8.1 jupyterlab-pygments 0.1.2 jupyterlab-widgets 1.0.0
keras 2.9.0 Keras-Preprocessing 1.1.2 kiwisolver 1.3.1
kalender-lunar-korea 0.2.1 kode bahasa 3.3.0 libclang 14.0.6
lightgbm 3.3.2 llvmlite 0.37.0 Kalender Lunar 0.0.9
Mako 1.2.0 Markdown 3.3.6 MarkupSafe 2.0.1
matplotlib 3.4.3 matplotlib-inline 0.1.2 missingno 0.5.1
menyetel salah 0.8.4 mleap 0.20.0 mlflow-skinny 1.28.0
metode ganda 1.8 murmurhash 1.0.8 ekstensi mypy 0.4.3
nbclient 0.5.3 nbconvert 6.1.0 nbformat 5.1.3
nest-asyncio 1.5.1 networkx 2.6.3 nltk 3.6.5
buku catatan 6.4.5 numba 0.54.1 numpy 1.20.3
oauthlib 3.2.0 opt-einsum 3.3.0 kemasan 21.0
pandas 1.3.4 pandas-profiling 3.1.0 pandocfilters 1.4.3
paramiko 2.9.2 parso 0.8.2 pathspec 0.9.0
pathy 0.6.2 kambing hitam 0.5.2 petastorm 0.11.4
pexpect 4.8.0 phik 0.12.2 pickleshare 0.7.5
Bantal 8.4.0 pip 21.2.4 platformdir 2.5.2
plotly 5.9.0 pmdarima 1.8.5 preshed 3.0.7
prompt-toolkit 3.0.20 nabi 1.0.1 protobuf 3.19.4
psutil 5.8.0 psycopg2 2.9.3 ptyprocess 0.7.0
pyarrow 7.0.0 pyasn1 0.4.8 pyasn1-modul 0.2.8
pybind11 2.10.0 pycparser 2,20 pydantic 1.9.2
Pygments 2.10.0 PyGObject 3.36.0 PyJWT 2.4.0
PyMeeus 0.5.11 PyNaCl 1.5.0 pyodbc 4.0.31
pyparsing 3.0.4 pyrsistent 0.18.0 pystan 2.19.1.1
python-apt 2.0.0+ubuntu0.20.4.7 python-dateutil 2.8.2 python-editor 1.0.4
pytz 2021.3 PyWavelets 1.1.1 PyYAML 6.0
pyzmq 22.2.1 regex 3 Agustus 2021 permintaan 2.26.0
requests-oauthlib 1.3.1 requests-unixsocket 0.2.0 rsa 4.9
s3transfer 0.5.2 scikit-learn 0.24.2 scipy 1.7.1
seaborn 0.11.2 Send2Trash 1.8.0 setuptools 58.0.4
setuptools-git 1.2 shap 0.41.0 simplejson 3.17.6
six 1.16.0 pemotong 0.0.7 smart-open 5.2.1
smmap 5.0.0 berjarak 3.4.0 spacy-legacy 3.0.9
spacy-loggers 1.0.3 spark-tensorflow-distributor 1.0.0 sqlparse 0.4.2
srsly 2.4.4 ssh-import-id 5.10 statsmodels 0.12.2
tabulate 0.8.9 terjerat-dalam-unicode 0.1.0 ketekunan 8.0.1
tensorboard 2.9.1 tensorboard-data-server 0.6.1 tensorboard-plugin-profile 2.8.0
tensorboard-plugin-wit 1.8.1 tensorflow 2.9.1 tensorflow-estimator 2.9.0
tensorflow-io-gcs-filesystem 0.26.0 termcolor 1.1.0 selesai 0.9.4
jalur uji 0.5.0 thinc 8.1.0 threadpoolctl 2.2.0
tokenize-rt 4.2.1 tokenisasi 0.12.1 tomli 2.0.1
obor 1.11.0+cu113 torchvision 0.12.0+cu113 tornado 6.1
tqdm 4.62.3 traitlets=5.0.5 5.1.0 Transformer 4.20.1
typer 0.4.2 typing-extensions 3.10.0.2 ujson 4.0.2
pembaruan otomatis 0.1 urllib3 1.26.7 virtualenv 20.8.0
visions 0.7.4 wasabi 0.10.1 wcwidth 0.2.5
webencodings=0.5.1 0.5.1 websocket-client 1.3.1 Werkzeug 2.0.2
roda 0.37.0 widgetsnbextension 3.6.0 terbungkus 1.12.1
xgboost 1.5.2 zipp 3.6.0

Pustaka R

Pustaka R identik dengan Pustaka R di Databricks Runtime 11.2.

Pustaka Java dan Scala (Kluster Scala 2.12)

Selain pustaka Java dan Scala di Databricks Runtime 11.2, Databricks Runtime 11.2 ML berisi JAR berikut:

Kluster CPU

ID Grup Artefak ID Versi
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-spark_2.12 1.5.2
ml.dmlc xgboost4j_2.12 1.5.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.28.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0

Kluster GPU

Grup ID Artefak ID Versi
com.typesafe.akka akka-actor_2.12 2.5.23
ml.combust.mleap mleap-databricks-runtime_2.12 v0.20.0-db1
ml.dmlc xgboost4j-gpu_2.12 1.5.2
ml.dmlc xgboost4j-spark-gpu_2.12 1.5.2
org.graphframes graphframes_2.12 0.8.2-db1-spark3.2
org.mlflow mlflow-client 1.28.0
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12 1.15.0