Databricks Runtime 13.3 LTS untuk Pembelajaran Mesin

Databricks Runtime 13.3 LTS untuk Pembelajaran Mesin menyediakan lingkungan siap pakai untuk pembelajaran mesin dan ilmu data berdasarkan Databricks Runtime 13.3 LTS. Runtime Bahasa Umum Databricks ML berisi banyak pustaka pembelajaran mesin populer, termasuk TensorFlow, PyTorch, dan XGBoost. Databricks Runtime ML mencakup AutoML, alat untuk secara otomatis melatih alur pembelajaran mesin. Databricks Runtime ML juga mendukung pelatihan pembelajaran mendalam menggunakan Horovod.


LTS berarti versi ini berada di bawah dukungan jangka panjang. Lihat Siklus hidup versi LTS Runtime Databricks.

Untuk informasi selengkapnya, termasuk instruksi untuk membuat kluster ML Runtime Databricks, lihat AI dan pembelajaran mesin di Databricks.


Untuk melihat catatan rilis untuk versi Databricks Runtime yang telah mencapai akhir dukungan (EoS), lihat Catatan rilis Databricks Runtime akhir dukungan. Versi EoS Databricks Runtime telah dihentikan dan mungkin tidak diperbarui.

Fitur dan peningkatan baru

Databricks Runtime 13.3 LTS ML dibangun di atas Databricks Runtime 13.3 LTS. Untuk informasi tentang apa yang baru di Databricks Runtime 13.3 LTS, termasuk Apache Spark MLlib dan SparkR, lihat catatan rilis Databricks Runtime 13.3 LTS .

Perubahan pada Penyimpanan Fitur Databricks

  • Databricks Runtime 13.3 LTS ML berisi klien Penyimpanan Fitur v0.14.0. Dengan versi klien 0.14.0 ke atas, Anda harus menentukan kolom kunci tanda waktu dalam primary_keys argumen. Kunci tanda waktu adalah bagian dari "kunci primer" yang secara unik mengidentifikasi setiap baris dalam tabel fitur.
  • Anda sekarang dapat mengecualikan nilai fitur dengan tanda waktu sebelum waktu yang ditentukan dari set pelatihan. Untuk detailnya, lihat Mengatur batas waktu untuk nilai fitur historis.
  • Fitur pembelajaran mesin sekarang dapat dihitung sesuai permintaan pada waktu inferensi. Logika, model, dan data komputasi fitur semuanya diatur oleh Katalog Unity. Ini memungkinkan model untuk menghitung fitur menggunakan input yang hanya tersedia pada waktu inferensi, seperti lokasi pengguna saat ini. Untuk informasi selengkapnya, lihat Fitur komputasi sesuai permintaan menggunakan fungsi yang ditentukan pengguna Python.

Lingkungan sistem

Lingkungan sistem di Databricks Runtime 13.3 LTS ML berbeda dari Databricks Runtime 13.3 LTS sebagai berikut:

Databricks Runtime 13.3 LTS ML mencakup XGBoost 1.7.3, yang tidak mendukung kluster GPU dengan kemampuan komputasi 5.2 ke bawah.

Paket miniconda telah dihapus dari Databricks Runtime 13.0 ML ke atas.


Bagian berikut mencantumkan pustaka yang disertakan dalam Databricks Runtime 13.3 LTS ML yang berbeda dari yang disertakan dalam Databricks Runtime 13.3 LTS.

Di bagian ini:

Pustaka tingkat atas

Databricks Runtime 13.3 LTS ML menyertakan pustaka tingkat atas berikut:

Pustaka Python

Databricks Runtime 13.3 LTS ML menggunakan Virtualenv untuk manajemen paket Python dan mencakup banyak paket ML populer.

Selain paket yang ditentukan di bagian berikut, Databricks Runtime 13.3 LTS ML juga mencakup paket berikut:

  • hyperopt 0.2.7+db3
  • 3.0.0_db1 sparkdl
  • automl 1.20.0

Untuk mereproduksi lingkungan Databricks Runtime ML Python di lingkungan virtual Python lokal Anda, unduh file requirements-13.3.txt dan jalankan pip install -r requirements-13.3.txt. Perintah ini menginstal semua pustaka sumber terbuka yang digunakan Databricks Runtime ML, tetapi tidak menginstal pustaka yang dikembangkan oleh Databricks, seperti databricks-automl, , databricks-feature-storeatau fork Databricks dari hyperopt.

Pustaka Phyton di kluster GPU

Pustaka R

Pustaka R identik dengan Pustaka R di Databricks Runtime 13.3 LTS.

Pustaka Java dan Scala (Kluster Scala 2.12)

Selain pustaka Java dan Scala di Databricks Runtime 13.3 LTS, Databricks Runtime 13.3 LTS ML berisi JAR berikut:

Kluster GPU

