Databricks Runtime 11.2 untuk Pembelajaran Mesin (EoS)
Catatan
Dukungan untuk versi Databricks Runtime ini telah berakhir. Untuk tanggal akhir dukungan, lihat Riwayat akhir dukungan. Untuk semua versi Databricks Runtime yang didukung, lihat Versi dan kompatibilitas catatan rilis Databricks Runtime.
Databricks Runtime 11.2 untuk Pembelajaran Mesin menyediakan lingkungan siap pakai untuk pembelajaran mesin dan ilmu data berdasarkan Databricks Runtime 11.2 (EoS). Databricks Runtime ML berisi banyak pustaka pembelajaran mesin populer, termasuk TensorFlow, PyTorch, dan XGBoost. Databricks Runtime ML mencakup AutoML, alat untuk secara otomatis melatih alur pembelajaran mesin. Databricks Runtime ML juga mendukung pelatihan pembelajaran mendalam menggunakan Horovod.
Untuk informasi selengkapnya, termasuk instruksi untuk membuat kluster ML Runtime Databricks, lihat AI dan pembelajaran mesin di Databricks.
Fitur dan peningkatan baru
Databricks Runtime 11.2 ML dibangun di atas Databricks Runtime 11.2. Untuk informasi tentang apa yang baru di Databricks Runtime 11.2, termasuk Apache Spark MLlib dan SparkR, lihat catatan rilis Databricks Runtime 11.2 (EoS).
Penyempurnaan AutoML
AutoML sekarang memiliki dukungan yang lebih baik untuk himpunan data yang tidak seimbang untuk masalah klasifikasi. Untuk detailnya, lihat Dukungan himpunan data yang tidak seimbang untuk masalah klasifikasi.
Peningkatan ke Penyimpanan Fitur Databricks
Peningkatan berikut telah dilakukan pada Penyimpanan Fitur Databricks.
- Untuk toko online, bidang pengguna dan kata sandi tidak digunakan lagi. Untuk menghindari ketidaksesuaian di masa mendatang, ubah semua penggunaan bidang ini menjadi
write_secret_prefix
.
- Semua dokumentasi dan output dari klien penyimpanan fitur sekarang merujuk ke versi klien (misalnya, 0.6.1) alih-alih versi ML Runtime Databricks (seperti 11.2).
Lingkungan sistem
Lingkungan sistem di Databricks Runtime 11.2 ML berbeda dari Databricks Runtime 11.2 sebagai berikut:
-
DBUtils: Databricks Runtime ML tidak menyertakan utilitas Pustaka (dbutils.library) (warisan).
Gunakan perintah
%pip
saja. Lihat Pustaka Python dengan cakupan notebook. - Untuk kluster GPU, Databricks Runtime ML menyertakan pustaka GPU NVIDIA berikut:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
Pustaka
Bagian berikut mencantumkan pustaka yang disertakan dalam Databricks Runtime 11.2 ML yang berbeda dari yang disertakan dalam Databricks Runtime 11.2.
Di bagian ini:
Pustaka tingkat atas
Databricks Runtime 11.2 ML menyertakan perpustakaan kelas atas berikut:
- GraphFrames
- Horovod dan HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
- Scikit-learn
Perpustakaan Python
Databricks Runtime 11.2 ML menggunakan Virtualenv untuk manajemen paket Python dan mencakup banyak paket ML populer.
Selain paket yang ditentukan di bagian berikut, Databricks Runtime 11.2 ML juga mencakup paket berikut:
- hyperopt 0.2.7.db1
- sparkdl 2.2.0_db6
- feature_store 0.6.0
- automl 1.12.3
Pustaka Python pada kluster CPU
Untuk mereproduksi lingkungan Databricks Runtime ML Python di lingkungan virtual Python lokal Anda, unduh file requirements-11.2.txt dan jalankan pip install -r requirements-11.2.txt
. Perintah ini menginstal semua pustaka sumber terbuka yang digunakan Databricks Runtime ML, tetapi tidak menginstal pustaka yang dikembangkan Azure Databricks, seperti databricks-automl
, databricks-feature-store
, atau fork Databricks dari hyperopt
.
Perpustakaan | Versi | Perpustakaan | Versi | Perpustakaan | Versi |
---|---|---|---|---|---|
absl-py | 1.0.0 | Antergos Linux | 2015.10 (ISO-Bergulir) | argon2-cffi | 20.1.0 |
Astor | 0.8.1 | astunparse | 1.6.3 | generator asinkron | 1.10 |
atribut | 21.2.0 | azure-core | 1.22.1 | azure-cosmos | 4.2.0 |
panggilan balik | 0.2.0 | backports.entry-points-selectable | 1.1.1 | bcrypt | 3.2.2 |
hitam | 22.3.0 | pemutih | 4.0.0 | kebahagiaan | 0.7.8 |
boto3 | 1.21.18 | botocore | 1.24.18 | cachetools | 5.2.0 |
katalog | 2.0.8 | sertifikat | 2021.10.8 | cffi | 1.14.6 |
chardet | 4.0.0 | charset-normalizer | 2.0.4 | klik | 8.0.3 |
cloudpickle | 2.0.0 | cmdstanpy | 0.9.68 | configparser | 5.2.0 |
convertdate | 2.4.0 | kriptografi | 3.4.8 | cycler | 0.10.0 |
cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.10 |
databricks-cli | 0.17.0 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
debugpy | 1.4.1 | pendekor | 5.1.0 | defusedxml | 0.7.1 |
dill | 0.3.4 | diskcache | 5.4.0 | distlib | 0.3.5 |
distro-info | 0.23ubuntu1 | titik masuk | 0,3 | ephem | 4.1.3 |
gambaran keseluruhan faset | 1.0.0 | fasttext | 0.9.2 | filelock | 3.3.1 |
Flask | 1.1.2 | flatbuffers | 1.12 | fsspec | 2021.8.1 |
masa depan | 0.18.2 | gast | 0.4.0 | gitdb | 4.0.9 |
GitPython | 3.1.27 | google-autentikasi | 2.6.0 | google-auth-oauthlib | 0.4.6 |
google-pasta | 0.2.0 | grpcio | 1.44.0 | gunicorn==19.9.0 | 20.1.0 |
gviz-api | 1.10.0 | h5py | 3.3.0 | hijri-converter | 2.2.4 |
hari libur | 0.14.2 | Horovod | 0.25.0 | htmlmin | 0.1.12 |
huggingface-hub | 0.8.1 | idna | 3.2 | ImageHash | 4.2.1 |
imbalanced-learn | 0.8.1 | importlib-metadata | 4.8.1 | ipykernel | 6.12.1 |
ipython | 7.32.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 |
isodate | 0.6.1 | itsdangerous | 2.0.1 | jedi | 0.18.0 |
Jinja2 | 2.11.3 | jmespath | 0.10.0 | joblib | 1.0.1 |
joblibspark | 0.5.0 | jsonschema | 3.2.0 | jupyter-client | 6.1.12 |
jupyter-core | 4.8.1 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
keras | 2.9.0 | Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 |
kalender lunar Korea | 0.2.1 | langcodes | 3.3.0 | libclang | 14.0.6 |
lightgbm | 3.3.2 | llvmlite | 0.37.0 | Kalender Lunar | 0.0.9 |
Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
mistune | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.28.0 |
multimethod | 1.8 | murmurhash | 1.0.8 | ekstensi mypy | 0.4.3 |
nbclient | 0.5.3 | nbconvert | 6.1.0 | nbformat | 5.1.3 |
nest-asyncio | 1.5.1 | networkx | 2.6.3 | nltk | 3.6.5 |
buku catatan | 6.4.5 | numba | 0.54.1 | numpy | 1.20.3 |
oauthlib | 3.2.0 | opt-einsum | 3.3.0 | kemasan | 21.0 |
pandas | 1.3.4 | pandas-profiling | 3.1.0 | pandocfilters | 1.4.3 |
paramiko | 2.9.2 | parso | 0.8.2 | pathspec | 0.9.0 |
-pati | 0.6.2 | orang yang mudah ditipu | 0.5.2 | petastorm | 0.11.4 |
pexpect | 4.8.0 | phik | 0.12.2 | pickleshare | 0.7.5 |
Bantal | 8.4.0 | pip | 21.2.4 | platformdirs | 2.5.2 |
plotly | 5.9.0 | pmdarima | 1.8.5 | preshed | 3.0.7 |
prometheus-client | 0.11.0 | prompt-toolkit | 3.0.20 | nabi | 1.0.1 |
protobuf | 3.19.4 | psutil | 5.8.0 | psycopg2 | 2.9.3 |
ptyprocess | 0.7.0 | pyarrow | 7.0.0 | pyasn1 | 0.4.8 |
pyasn1-modul | 0.2.8 | pybind11 | 2.10.0 | pycparser | 2,20 |
pydantic | 1.9.2 | Pygments | 2.10.0 | PyGObject | 3.36.0 |
PyJWT | 2.4.0 | PyMeeus | 0.5.11 | PyNaCl | 1.5.0 |
pyodbc | 4.0.31 | pyparsing | 3.0.4 | pyrsistent | 0.18.0 |
pystan | 2.19.1.1 | python-apt | 2.0.0+ubuntu0.20.4.7 | python-dateutil | 2.8.2 |
python-editor | 1.0.4 | pytz | 2021.3 | PyWavelets | 1.1.1 |
PyYAML | 6.0 | pyzmq | 22.2.1 | regex | 3 Agustus 2021 |
permintaan | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
rsa | 4.9 | s3transfer | 0.5.2 | scikit-learn | 0.24.2 |
scipy | 1.7.1 | seaborn | 0.11.2 | Send2Trash | 1.8.0 |
setuptools | 58.0.4 | setuptools-git | 1.2 | shap | 0.41.0 |
simplejson | 3.17.6 | six | 1.16.0 | pemotong | 0.0.7 |
smart-open | 5.2.1 | smmap | 5.0.0 | luas | 3.4.0 |
spacy-legacy | 3.0.9 | spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 |
sqlparse | 0.4.2 | seriusan | 2.4.4 | ssh-import-id | 5.10 |
statsmodels | 0.12.2 | menyusun | 0.8.9 | terjerat-dalam-unicode | 0.1.0 |
ketekunan | 8.0.1 | TensorBoard | 2.9.1 | tensorboard-data-server | 0.6.1 |
tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 | tensorflow-cpu | 2.9.1 |
tensorflow-estimator | 2.9.0 | tensorflow-io-gcs-filesystem | 0.26.0 | termcolor | 1.1.0 |
selesai | 0.9.4 | testpath | 0.5.0 | thinc | 8.1.0 |
threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 | pemroses token atau pemisah kata | 0.12.1 |
tomli | 2.0.1 | obor | 1.11.0+cpu | torchvision | 0.12.0+cpu |
tornado | 6.1 | tqdm | 4.62.3 | traitlets=5.0.5 | 5.1.0 |
Transformer | 4.20.1 | typer | 0.4.2 | typing-extensions | 3.10.0.2 |
ujson | 4.0.2 | peningkatan otomatis | 0.1 | urllib3 | 1.26.7 |
virtualenv | 20.8.0 | visions | 0.7.4 | wasabi | 0.10.1 |
wcwidth | 0.2.5 | webencodings=0.5.1 | 0.5.1 | Klien WebSocket | 1.3.1 |
Werkzeug | 2.0.2 | roda | 0.37.0 | widgetsnbextension | 3.6.0 |
terbungkus | 1.12.1 | xgboost | 1.5.2 | zipp | 3.6.0 |
Pustaka Phyton di kluster GPU
Perpustakaan | Versi | Perpustakaan | Versi | Perpustakaan | Versi |
---|---|---|---|---|---|
absl-py | 1.0.0 | Antergos Linux | 2015.10 (ISO-Rolling) | argon2-cffi | 20.1.0 |
astor | 0.8.1 | astunparse | 1.6.3 | async-generator | 1.10 |
atribut | 21.2.0 | azure-core | 1.22.1 | azure-cosmos | 4.2.0 |
panggilan balik | 0.2.0 | backports.entry-points-selectable | 1.1.1 | bcrypt | 3.2.2 |
hitam | 22.3.0 | pemutih | 4.0.0 | kebahagiaan | 0.7.8 |
boto3 | 1.21.18 | botocore | 1.24.18 | cachetools | 5.2.0 |
katalog | 2.0.8 | sertifikat | 2021.10.8 | cffi | 1.14.6 |
chardet | 4.0.0 | charset-normalizer | 2.0.4 | klik | 8.0.3 |
cloudpickle (perpustakaan Python untuk serialisasi objek) | 2.0.0 | cmdstanpy | 0.9.68 | configparser | 5.2.0 |
convertdate | 2.4.0 | kriptografi | 3.4.8 | pengendara sepeda | 0.10.0 |
cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.10 |
databricks-cli | 0.17.0 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
debugpy | 1.4.1 | dekorator | 5.1.0 | defusedxml | 0.7.1 |
adasku | 0.3.4 | diskcache | 5.4.0 | distlib | 0.3.5 |
distro-info | 0.23ubuntu1 | titik masuk | 0,3 | ephem | 4.1.3 |
ikhtisar-faset | 1.0.0 | fasttext | 0.9.2 | filelock | 3.3.1 |
Flask | 1.1.2 | flatbuffers | 1.12 | fsspec | 1 Agustus 2021 |
masa depan | 0.18.2 | gast | 0.4.0 | gitdb | 4.0.9 |
GitPython | 3.1.27 | google-auth | 2.6.0 | google-auth-oauthlib | 0.4.6 |
google-pasta | 0.2.0 | grpcio | 1.44.0 | gunicorn | 20.1.0 |
gviz-api | 1.10.0 | h5py | 3.3.0 | hijri-converter | 2.2.4 |
hari libur | 0.14.2 | Horovod | 0.25.0 | htmlmin | 0.1.12 |
huggingface-hub (platform kolaborasi untuk pembelajaran mesin) | 0.8.1 | idna | 3.2 | ImageHash | 4.2.1 |
pembelajaran data tidak seimbang | 0.8.1 | importlib-metadata | 4.8.1 | ipykernel | 6.12.1 |
ipython | 7.32.0 | ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 |
isodate | 0.6.1 | itsdangerous | 2.0.1 | jedi | 0.18.0 |
Jinja2 | 2.11.3 | jmespath | 0.10.0 | joblib | 1.0.1 |
joblibspark | 0.5.0 | jsonschema | 3.2.0 | jupyter-client | 6.1.12 |
jupyter-core | 4.8.1 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 |
keras | 2.9.0 | Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 |
kalender-lunar-korea | 0.2.1 | kode bahasa | 3.3.0 | libclang | 14.0.6 |
lightgbm | 3.3.2 | llvmlite | 0.37.0 | Kalender Lunar | 0.0.9 |
Mako | 1.2.0 | Markdown | 3.3.6 | MarkupSafe | 2.0.1 |
matplotlib | 3.4.3 | matplotlib-inline | 0.1.2 | missingno | 0.5.1 |
menyetel salah | 0.8.4 | mleap | 0.20.0 | mlflow-skinny | 1.28.0 |
metode ganda | 1.8 | murmurhash | 1.0.8 | ekstensi mypy | 0.4.3 |
nbclient | 0.5.3 | nbconvert | 6.1.0 | nbformat | 5.1.3 |
nest-asyncio | 1.5.1 | networkx | 2.6.3 | nltk | 3.6.5 |
buku catatan | 6.4.5 | numba | 0.54.1 | numpy | 1.20.3 |
oauthlib | 3.2.0 | opt-einsum | 3.3.0 | kemasan | 21.0 |
pandas | 1.3.4 | pandas-profiling | 3.1.0 | pandocfilters | 1.4.3 |
paramiko | 2.9.2 | parso | 0.8.2 | pathspec | 0.9.0 |
pathy | 0.6.2 | kambing hitam | 0.5.2 | petastorm | 0.11.4 |
pexpect | 4.8.0 | phik | 0.12.2 | pickleshare | 0.7.5 |
Bantal | 8.4.0 | pip | 21.2.4 | platformdir | 2.5.2 |
plotly | 5.9.0 | pmdarima | 1.8.5 | preshed | 3.0.7 |
prompt-toolkit | 3.0.20 | nabi | 1.0.1 | protobuf | 3.19.4 |
psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
pyarrow | 7.0.0 | pyasn1 | 0.4.8 | pyasn1-modul | 0.2.8 |
pybind11 | 2.10.0 | pycparser | 2,20 | pydantic | 1.9.2 |
Pygments | 2.10.0 | PyGObject | 3.36.0 | PyJWT | 2.4.0 |
PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
pyparsing | 3.0.4 | pyrsistent | 0.18.0 | pystan | 2.19.1.1 |
python-apt | 2.0.0+ubuntu0.20.4.7 | python-dateutil | 2.8.2 | python-editor | 1.0.4 |
pytz | 2021.3 | PyWavelets | 1.1.1 | PyYAML | 6.0 |
pyzmq | 22.2.1 | regex | 3 Agustus 2021 | permintaan | 2.26.0 |
requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 | rsa | 4.9 |
s3transfer | 0.5.2 | scikit-learn | 0.24.2 | scipy | 1.7.1 |
seaborn | 0.11.2 | Send2Trash | 1.8.0 | setuptools | 58.0.4 |
setuptools-git | 1.2 | shap | 0.41.0 | simplejson | 3.17.6 |
six | 1.16.0 | pemotong | 0.0.7 | smart-open | 5.2.1 |
smmap | 5.0.0 | berjarak | 3.4.0 | spacy-legacy | 3.0.9 |
spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 |
srsly | 2.4.4 | ssh-import-id | 5.10 | statsmodels | 0.12.2 |
tabulate | 0.8.9 | terjerat-dalam-unicode | 0.1.0 | ketekunan | 8.0.1 |
tensorboard | 2.9.1 | tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.8.0 |
tensorboard-plugin-wit | 1.8.1 | tensorflow | 2.9.1 | tensorflow-estimator | 2.9.0 |
tensorflow-io-gcs-filesystem | 0.26.0 | termcolor | 1.1.0 | selesai | 0.9.4 |
jalur uji | 0.5.0 | thinc | 8.1.0 | threadpoolctl | 2.2.0 |
tokenize-rt | 4.2.1 | tokenisasi | 0.12.1 | tomli | 2.0.1 |
obor | 1.11.0+cu113 | torchvision | 0.12.0+cu113 | tornado | 6.1 |
tqdm | 4.62.3 | traitlets=5.0.5 | 5.1.0 | Transformer | 4.20.1 |
typer | 0.4.2 | typing-extensions | 3.10.0.2 | ujson | 4.0.2 |
pembaruan otomatis | 0.1 | urllib3 | 1.26.7 | virtualenv | 20.8.0 |
visions | 0.7.4 | wasabi | 0.10.1 | wcwidth | 0.2.5 |
webencodings=0.5.1 | 0.5.1 | websocket-client | 1.3.1 | Werkzeug | 2.0.2 |
roda | 0.37.0 | widgetsnbextension | 3.6.0 | terbungkus | 1.12.1 |
xgboost | 1.5.2 | zipp | 3.6.0 |
Pustaka R
Pustaka R identik dengan Pustaka R di Databricks Runtime 11.2.
Pustaka Java dan Scala (Kluster Scala 2.12)
Selain pustaka Java dan Scala di Databricks Runtime 11.2, Databricks Runtime 11.2 ML berisi JAR berikut:
Kluster CPU
ID Grup | Artefak ID | Versi |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-spark_2.12 | 1.5.2 |
ml.dmlc | xgboost4j_2.12 | 1.5.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 1.28.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
Kluster GPU
Grup ID | Artefak ID | Versi |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.5.2 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.5.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 1.28.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |