適用於機器學習的 Databricks Runtime 11.3 LTS
適用於機器學習的 Databricks Runtime 11.3 LTS 提供以 Databricks Runtime 11.3 LTS 為基礎的機器學習和資料科學現成環境。 Databricks Runtime ML 含有許多熱門的機器學習程式庫,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包含 AutoML,這是可自動訓練機器學習管線的工具。 Databricks Runtime ML 也支援使用 Horovod 的分散式深度學習訓練。
注意
LTS 表示此版本受到長期支援。 請參閱 Databricks Runtime LTS 版本生命週期 (英文)。
如需詳細資訊,包括建立 Databricks Runtime ML 叢集的指示,請參閱 Databricks 上的 AI 和機器學習 (英文)。
提示
若要查看已達到終止支援 (EoS) 之 Databricks Runtime 版本的版本資訊,請參閱終止支援 Databricks Runtime 版本資訊。 EoS Databricks Runtime 版本已淘汰,且可能未更新。
新功能和改進
Databricks Runtime 11.3 LTS ML 是以 Databricks Runtime 11.3 LTS 為基礎而建置。 如需 Databricks Runtime 11.3 LTS 新增功能的相關資訊,包括 Apache Spark MLlib 和 SparkR,請參閱 Databricks Runtime 11.3 LTS 版本資訊。
AutoML 的增強功能
AutoML 現在支援在 AutoML 實驗中整合現有的 Feature Store 特徵表。 如需詳細資訊,請參閱 AutoML 功能存放區整合。
AutoML 所產生的試用筆記本現已包括程式碼片段,可讓使用者重新執行超參數微調。
AutoML 現已支援 DecimalType
功能。
錯誤修正
Databricks Runtime 11.3 LTS ML 包括升級版本的 sparkdl.xgboost
。 舊版 sparkdl.xgboost
包括此版本中已修正的 Bug,因此 Databricks 建議程式庫的使用者升級至 Databricks Runtime 11.3 LTS ML。
準備迎接未來的發佈版本
即將推出的 Databricks Runtime ML 版本將包括 sklearn
1.0 版。 請造訪 sklearn
文件 取得有關如何準備此一變動的詳細資訊。
Databricks Runtime ML 包括兩個 openblas
套件。 該 /opt/OpenBLAS
套件在 Databricks Runtime 11.3 LTS ML 中已遭取代,並且即將推出的版本也將予以移除。
系統環境
Databricks Runtime 11.3 LTS ML 中的系統環境與 Databricks Runtime 11.3 LTS 有所不同,如下所示:
-
DBUtils:Databricks Runtime ML 不包括程式庫公用程式 (dbutils.library) (舊版)。
請改用
%pip
命令。 請參閱限於筆記本的 Python 程式庫。 - 針對 GPU 叢集,Databricks Runtime ML 包括下列 NVIDIA GPU 程式庫:
- CUDA 11.3
- cuDNN 8.0.5.39
- NCCL 2.9.9
- TensorRT 7.2.2
Databricks Runtime 11.3 LTS ML 包含 XGBoost 1.6.1,其不支援具有計算功能 5.2 及以下的 GPU 叢集。
圖書館
下列各節列出 Databricks Runtime 11.3 LTS ML 中包含的連結庫,與 Databricks Runtime 11.3 LTS 中包含的連結庫不同。
本節內容:
頂層程式庫
Databricks Runtime 11.3 LTS ML 包括下列頂層程式庫:
- GraphFrames
- Horovod 及 HorovodRunner
- MLflow
- PyTorch
- spark-tensorflow-connector
- TensorFlow
- TensorBoard
- Scikit-learn
Python 程式庫
Databricks Runtime 11.3 LTS ML 使用 Virtualenv 進行 Python 套件管理,且包括許多熱門 ML 套件。
除了下列各章節中指定的套件之外,Databricks Runtime 11.3 LTS ML 也包括下列套件:
- hyperopt 0.2.7.db1
- sparkdl 2.3.0-db3
- feature_store 0.7.0
- automl 1.13.2
若要在本機 Python 虛擬環境中重現 Databricks Runtime ML Python 環境,請下載 requirements-11.3.txt 檔案並執行 pip install -r requirements-11.3.txt
。 此命令會安裝 Databricks Runtime ML 使用的所有開放原始碼程式庫,但不會安裝 Databricks 所開發的程式庫,例如 databricks-automl
、 databricks-feature-store
或 hyperopt
的 Databricks 派生。
CPU 叢集的 Python 程式庫
圖書館 | 版本 | 圖書館 | 版本 | 圖書館 | 版本 |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 20.1.0 | 阿斯托 | 0.8.1 |
astunparse | 1.6.3 | 非同步生成器 (async-generator) | 1.10 | 屬性 | 21.2.0 |
azure-core | 1.22.1 | azure-cosmos | 4.2.0 | backcall | 0.2.0 |
backports.entry-points-selectable | 1.1.1 | bcrypt | 4.0.0 | 黑色 | 22.3.0 |
漂白劑 | 4.0.0 | blis | 0.7.8 | boto3 | 1.21.18 |
botocore | 1.24.18 | cachetools | 5.2.0 | 目錄 | 2.0.8 |
certifi | 2021.10.8 | cffi | 1.14.6 | chardet | 4.0.0 |
charset-normalizer | 2.0.4 | 點擊 | 8.0.3 | cloudpickle | 2.0.0 |
cmdstanpy | 0.9.68 | 糖果 | 0.0.1 | configparser | 5.2.0 |
轉換日期 | 2.4.0 | 密碼編譯 | 3.4.8 | cycler | 0.10.0 |
cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.11 |
databricks-cli | 0.17.3 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
debugpy | 1.4.1 | 裝飾器 | 5.1.0 | defusedxml | 0.7.1 |
蒔蘿 | 0.3.4 | diskcache | 5.4.0 | distlib | 0.3.6 |
入口點 | 0.3 | ephem | 4.1.3 | 面向概覽 | 1.0.0 |
fasttext | 0.9.2 | 文件鎖定 | 3.3.1 | Flask | 1.1.2 |
flatbuffers | 1.12 | fsspec | 2021年8月1日 | 未來 | 0.18.2 |
gast | 0.4.0 | gitdb | 4.0.9 | GitPython | 3.1.27 |
google-auth | 2.6.0 | google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 |
grpcio | 1.44.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
h5py | 3.3.0 | 伊斯蘭曆轉換器 | 2.2.4 | 假日 | 0.15 |
horovod | 0.25.0 | htmlmin | 0.1.12 | huggingface-hub | 0.9.1 |
idna | 3.2 | ImageHash | 4.3.0 | imbalanced-learn (不平衡學習) | 0.8.1 |
importlib-metadata | 4.8.1 | ipykernel | 6.12.1 | ipython | 7.32.0 |
ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 | isodate | 0.6.1 |
itsdangerous (Python 套件名稱) | 2.0.1 | jedi | 0.18.0 | Jinja2 | 2.11.3 |
jmespath | 0.10.0 | joblib | 1.0.1 | joblibspark | 0.5.0 |
jsonschema | 3.2.0 | jupyter-client | 6.1.12 | jupyter-core | 4.8.1 |
jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 | keras | 2.9.0 |
Keras-Preprocessing(Keras 預處理) | 1.1.2 | kiwisolver | 1.3.1 | 韓國農曆 kalender | 0.3.1 |
語言代碼 | 3.3.0 | libclang | 14.0.6 | lightgbm | 3.3.2 |
llvmlite | 0.37.0 | LunarCalendar | 0.0.9 | Mako | 1.2.0 |
Markdown | 3.3.6 | MarkupSafe | 2.0.1 | matplotlib | 3.4.3 |
matplotlib-inline | 0.1.2 | 迷失號 (missingno) | 0.5.1 | mistune | 0.8.4 |
mleap | 0.20.0 | mlflow-skinny | 1.29.0 | 多方法 | 1.9 |
murmurhash | 1.0.8 | mypy-extensions | 0.4.3 | nbclient | 0.5.3 |
nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
networkx | 2.6.3 | nltk | 3.6.5 | 筆記本 | 6.4.5 |
numba | 0.54.1 | numpy | 1.20.3 | oauthlib | 3.2.0 |
opt-einsum | 3.3.0 | 包裝 | 21.0 | pandas | 1.3.4 |
pandas-profiling | 3.1.0 | pandocfilters | 1.4.3 | paramiko | 2.9.2 |
parso | 0.8.2 | pathspec | 0.9.0 | pathy | 0.6.2 |
傻瓜 | 0.5.2 | petastorm | 0.11.4 | pexpect | 4.8.0 |
phik | 0.12.2 | pickleshare | 0.7.5 | 枕頭 | 8.4.0 |
pip(Python的套件管理工具) | 21.2.4 | platformdirs | 2.5.2 | plotly | 5.9.0 |
pmdarima | 1.8.5 | preshed | 3.0.7 | prometheus-client | 0.11.0 |
prompt-toolkit | 3.0.20 | 先知 | 1.0.1 | protobuf | 3.19.4 |
psutil | 5.8.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
pyarrow | 7.0.0 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
pybind11 | 2.10.0 | pycparser | 2.20 | pydantic | 1.9.2 |
Pygments | 2.10.0 | PyGObject | 3.36.0 | PyJWT | 2.5.0 |
PyMeeus | 0.5.11 | PyNaCl | 1.5.0 | pyodbc | 4.0.31 |
pyparsing | 3.0.4 | pyrsistent | 0.18.0 | pystan | 2.19.1.1 |
python-dateutil | 2.8.2 | Python 編輯器 | 1.0.4 | pytz | 2021.3 |
PyWavelets | 1.1.1 | PyYAML | 6.0 | pyzmq | 22.2.1 |
RegEx | 2021年8月3日 | 請求 | 2.26.0 | requests-oauthlib | 1.3.1 |
requests-unixsocket | 0.2.0 | rsa | 4.9 | s3transfer | 0.5.2 |
scikit-learn | 0.24.2 | scipy | 1.7.1 | seaborn (海生) | 0.11.3 |
Send2Trash | 1.8.0 | setuptools | 58.0.4 | setuptools-git | 1.2 |
形狀 | 0.41.0 | simplejson | 3.17.6 | 六 | 1.16.0 |
切片機 | 0.0.7 | smart-open | 5.2.1 | smmap | 5.0.0 |
spacy | 3.4.1 | spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 |
spark-tensorflow-distributor | 1.0.0 | sqlparse | 0.4.2 | srsly | 2.4.4 |
ssh-import-id | 5.10 | statsmodels | 0.12.2 | 製表 | 0.8.9 |
與 Unicode 糾纏 | 0.1.0 | 韌性 | 8.0.1 | TensorBoard(張量儀表板) | 2.9.1 |
tensorboard-data-server | 0.6.1 | tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 |
tensorflow-cpu | 2.9.1 | TensorFlow 估計器 | 2.9.0 | tensorflow-io-gcs-filesystem | 0.27.0 |
termcolor | 2.0.1 | 完成 | 0.9.4 | testpath | 0.5.0 |
thinc | 8.1.2 | threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 |
分詞器 | 0.12.1 | tomli | 2.0.1 | 火炬 | 1.12.1+cpu |
torchvision | 0.13.1+cpu | tornado | 6.1 | tqdm | 4.62.3 |
traitlets | 5.1.0 | 轉換器 | 4.21.2 | 打字員 | 0.4.2 |
typing-extensions | 3.10.0.2 | ujson | 4.0.2 | 自動升級管理程序 (unattended-upgrades) | 0.1 |
urllib3 | 1.26.7 | virtualenv | 20.8.0 | 願景 | 0.7.4 |
山葵 | 0.10.1 | wcwidth | 0.2.5 | webencodings | 0.5.1 |
WebSocket 客戶端 | 1.3.1 | Werkzeug | 2.0.2 | 輪子 | 0.37.0 |
widgetsnbextension | 3.6.0 | 包裹 | 1.12.1 | xgboost | 1.6.2 |
zipp | 3.6.0 |
GPU 叢集上的 Python 程式庫
圖書館 | 版本 | 圖書館 | 版本 | 圖書館 | 版本 |
---|---|---|---|---|---|
absl-py | 1.0.0 | argon2-cffi | 20.1.0 | astor | 0.8.1 |
astunparse | 1.6.3 | async-generator | 1.10 | 屬性 | 21.2.0 |
azure-core | 1.22.1 | azure-cosmos | 4.2.0 | 回調函數 | 0.2.0 |
backports.entry-points-selectable | 1.1.1 | bcrypt | 4.0.0 | 黑色 | 22.3.0 |
漂白劑 | 4.0.0 | blis | 0.7.8 | boto3 | 1.21.18 |
botocore | 1.24.18 | cachetools | 5.2.0 | 目錄 | 2.0.8 |
certifi | 2021.10.8 | cffi | 1.14.6 | chardet | 4.0.0 |
charset-normalizer | 2.0.4 | 點擊 | 8.0.3 | cloudpickle | 2.0.0 |
cmdstanpy | 0.9.68 | 糖果製品 | 0.0.1 | configparser | 5.2.0 |
轉換日期 | 2.4.0 | 密碼編譯 | 3.4.8 | cycler | 0.10.0 |
cymem | 2.0.6 | Cython | 0.29.24 | databricks-automl-runtime | 0.2.11 |
databricks 命令行介面 (CLI) | 0.17.3 | dbl-tempo | 0.1.12 | dbus-python | 1.2.16 |
debugpy | 1.4.1 | decorator | 5.1.0 | defusedxml | 0.7.1 |
蒔蘿 | 0.3.4 | diskcache | 5.4.0 | distlib | 0.3.6 |
入口點 | 0.3 | ephem | 4.1.3 | 面向概述 | 1.0.0 |
fasttext | 0.9.2 | 文件鎖定 | 3.3.1 | Flask | 1.1.2 |
flatbuffers | 1.12 | fsspec | 2021年8月1日 | 未來 | 0.18.2 |
gast | 0.4.0 | gitdb | 4.0.9 | GitPython | 3.1.27 |
Google 認證 | 2.6.0 | google-auth-oauthlib | 0.4.6 | google-pasta | 0.2.0 |
grpcio | 1.44.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
h5py | 3.3.0 | 伊斯蘭曆轉換器 | 2.2.4 | 假期 | 0.15 |
horovod | 0.25.0 | htmlmin | 0.1.12 | huggingface-hub | 0.9.1 |
idna | 3.2 | ImageHash | 4.3.0 | imbalanced-learn(不平衡資料學習庫) | 0.8.1 |
importlib-metadata | 4.8.1 | ipykernel | 6.12.1 | ipython | 7.32.0 |
ipython-genutils | 0.2.0 | ipywidgets | 7.7.0 | isodate | 0.6.1 |
itsdangerous | 2.0.1 | jedi | 0.18.0 | Jinja2 | 2.11.3 |
jmespath | 0.10.0 | joblib | 1.0.1 | joblibspark | 0.5.0 |
jsonschema | 3.2.0 | jupyter-client | 6.1.12 | jupyter-core | 4.8.1 |
jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 1.0.0 | keras | 2.9.0 |
Keras-Preprocessing | 1.1.2 | kiwisolver | 1.3.1 | 韓國農曆 | 0.3.1 |
語言代碼 | 3.3.0 | libclang | 14.0.6 | lightgbm | 3.3.2 |
llvmlite | 0.37.0 | LunarCalendar | 0.0.9 | Mako | 1.2.0 |
Markdown | 3.3.6 | MarkupSafe | 2.0.1 | matplotlib | 3.4.3 |
matplotlib-inline | 0.1.2 | missingno | 0.5.1 | mistune | 0.8.4 |
mleap | 0.20.0 | mlflow-skinny | 1.29.0 | 多方法 | 1.9 |
murmurhash | 1.0.8 | mypy-extensions | 0.4.3 | nbclient | 0.5.3 |
nbconvert | 6.1.0 | nbformat | 5.1.3 | nest-asyncio | 1.5.1 |
networkx | 2.6.3 | nltk | 3.6.5 | 筆記本 | 6.4.5 |
numba (Python 套件庫,用於優化數值處理) | 0.54.1 | numpy | 1.20.3 | oauthlib | 3.2.0 |
opt-einsum | 3.3.0 | 包裝 | 21.0 | pandas | 1.3.4 |
pandas-profiling | 3.1.0 | pandocfilters | 1.4.3 | paramiko | 2.9.2 |
parso | 0.8.2 | pathspec | 0.9.0 | 病理 | 0.6.2 |
替罪羊 | 0.5.2 | petastorm | 0.11.4 | pexpect | 4.8.0 |
phik | 0.12.2 | pickleshare | 0.7.5 | 枕頭 | 8.4.0 |
pip | 21.2.4 | platformdirs | 2.5.2 | plotly | 5.9.0 |
pmdarima | 1.8.5 | preshed | 3.0.7 | prompt-toolkit(提示工具包) | 3.0.20 |
先知 | 1.0.1 | protobuf | 3.19.4 | psutil | 5.8.0 |
psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | pyarrow | 7.0.0 |
pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.10.0 |
pycparser | 2.20 | Python 資料驗證套件 pydantic | 1.9.2 | Pygments | 2.10.0 |
PyGObject | 3.36.0 | PyJWT | 2.5.0 | PyMeeus | 0.5.11 |
PyNaCl | 1.5.0 | pyodbc | 4.0.31 | pyparsing | 3.0.4 |
pyrsistent | 0.18.0 | pystan | 2.19.1.1 | python-dateutil | 2.8.2 |
Python 編輯器 | 1.0.4 | pytz | 2021.3 | PyWavelets | 1.1.1 |
PyYAML | 6.0 | pyzmq | 22.2.1 | RegEx | 2021年8月3日 |
請求 | 2.26.0 | requests-oauthlib | 1.3.1 | requests-unixsocket | 0.2.0 |
rsa | 4.9 | s3transfer | 0.5.2 | scikit-learn | 0.24.2 |
scipy | 1.7.1 | seaborn | 0.11.3 | Send2Trash | 1.8.0 |
setuptools | 58.0.4 | setuptools-git | 1.2 | shap | 0.41.0 |
simplejson | 3.17.6 | 六 | 1.16.0 | 切片機 | 0.0.7 |
smart-open | 5.2.1 | smmap | 5.0.0 | 寬敞 | 3.4.1 |
spacy-legacy | 3.0.10 | spacy-loggers | 1.0.3 | spark-tensorflow-distributor | 1.0.0 |
sqlparse | 0.4.2 | 真的嗎 | 2.4.4 | ssh-import-id | 5.10 |
statsmodels | 0.12.2 | 製表 | 0.8.9 | Unicode混亂中 | 0.1.0 |
韌性 | 8.0.1 | tensorboard | 2.9.1 | tensorboard-data-server | 0.6.1 |
tensorboard-plugin-profile | 2.8.0 | tensorboard-plugin-wit | 1.8.1 | tensorflow | 2.9.1 |
tensorflow-estimator | 2.9.0 | tensorflow-io-gcs-filesystem | 0.27.0 | termcolor | 2.0.1 |
結束 | 0.9.4 | 测试路径 (testpath) | 0.5.0 | thinc | 8.1.2 |
threadpoolctl | 2.2.0 | tokenize-rt | 4.2.1 | 分詞器 | 0.12.1 |
tomli | 2.0.1 | 手電筒 or 火炬 (depending on context) | 1.12.1+cu113 | torchvision(Python機器學習模組) | 0.13.1+cu113 |
tornado | 6.1 | tqdm | 4.62.3 | traitlets | 5.1.0 |
轉換器 | 4.21.2 | typer | 0.4.2 | typing-extensions | 3.10.0.2 |
ujson(JSON 處理庫) | 4.0.2 | 無人值守升級 | 0.1 | urllib3 | 1.26.7 |
virtualenv | 20.8.0 | 願景 | 0.7.4 | wasabi | 0.10.1 |
wcwidth | 0.2.5 | 網頁編碼 | 0.5.1 | websocket-client | 1.3.1 |
Werkzeug | 2.0.2 | 輪子 | 0.37.0 | widgetsnbextension | 3.6.0 |
包裹 | 1.12.1 | xgboost | 1.6.2 | zipp | 3.6.0 |
R 程式庫
R 程式庫與 Databricks Runtime 11.3 LTS 中的 R 程式庫相同。
Java 和 Scala 程式庫 (Scala 2.12 叢集)
除了 Databricks Runtime 11.3 LTS 中的 JAVA 和 Scala 程式庫之外,Databricks Runtime 11.3 LTS ML 還包括下列 JAR:
CPU 叢集
群組識別碼 | 成品識別碼 | 版本 |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-spark_2.12 | 1.6.2 |
ml.dmlc | xgboost4j_2.12 | 1.6.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 1.29.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |
GPU 群集
群組識別碼 | 成品識別碼 | 版本 |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.combust.mleap | mleap-databricks-runtime_2.12 | v0.20.0-db1 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.6.2 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.6.2 |
org.graphframes | graphframes_2.12 | 0.8.2-db1-spark3.2 |
org.mlflow | mlflow-client | 1.29.0 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12 | 1.15.0 |