Mengelola format buku catatan
Artikel ini menjelaskan format buku catatan default di Azure Databricks, cara mengubah format buku catatan Anda, dan cara mengelola penerapan jika buku catatan Anda berada di folder yang dikontrol sumber.
Secara default, notebook dalam Databricks dibuat dalam format .ipynb
(IPython atau Jupyter). Anda juga dapat memilih untuk menggunakan format sumber sebagai gantinya.
Anda masih bisa mengimpor dan mengekspor buku catatan dalam berbagai format. Lihat Mengekspor dan mengimpor buku catatan Databricks.
format buku catatan
Databricks mendukung pembuatan dan pengeditan notebook dalam dua format: IPYNB (default) dan sumber.
Anda dapat mengelola file sumber, termasuk notebook, menggunakan folder Git . Hanya jenis aset Databricks tertentu yang didukung dalam folder Git. Format buku catatan memiliki implikasi pada output apa yang diterapkan ke repositori jarak jauh, seperti yang dijelaskan dalam tabel di bawah ini.
Format sumber notebook | Rincian |
---|---|
sumber | Format dasar yang hanya mengambil kode sumber, dengan akhiran yang menandakan bahasa kode, seperti .py , .scala , .r dan .sql . |
IPYNB (Jupyter) | Format kaya yang menangkap kode sumber, lingkungan notebook, definisi visualisasi, widget notebook, dan output opsional. Notebook IPYNB dapat berisi kode dalam bahasa apa pun yang didukung oleh notebook Databricks (meskipun bagian py dari .ipynb ). Format IPYNB (Jupyter) memungkinkan pengguna untuk memilih untuk mencatat output. IPYNB juga mendukung pengalaman tampilan yang lebih baik untuk notebook Databricks di repositori Git jarak jauh. |
Untuk membedakan notebook Databricks dari file Python, Scala, dan SQL reguler, Azure Databricks menambahkan komentar "Databricks notebook source
" ke bagian atas notebook Python, Scala, dan SQL. Komentar ini memastikan bahwa Azure Databricks mengurai file dengan benar sebagai buku catatan daripada file skrip.
Nota
Apa itu "output"?
Output adalah hasil menjalankan notebook di platform Databricks, termasuk tampilan tabel dan visualisasi.
Mengubah pengaturan format buku catatan default
Notebook IPYNB adalah format default saat membuat buku catatan baru di Azure Databricks.
Untuk mengubah default ke format sumber Azure Databricks, masuk ke ruang kerja Azure Databricks Anda, klik profil Anda di kanan atas halaman, lalu klik pengaturan dan navigasi ke Pengembang. Ubah format default buku catatan di bawah judul Pengaturan Editor.
Mengonversi format buku catatan
Anda dapat mengonversi buku catatan yang sudah ada ke format lain melalui antarmuka pengguna Azure Databricks.
Untuk mengonversi buku catatan yang sudah ada ke format lain:
Buka buku catatan di ruang kerja Anda.
Pilih File dari menu ruang kerja, lalu pilih format buku catatan , lalu pilih format yang Anda inginkan. Anda dapat memilih Jupyter (.ipynb) (Disarankan) atau Sumber (.scala, .py, .sql, .r). Format buku catatan saat ini berwarna abu-abu dan memiliki tanda centang di sampingnya.
Untuk informasi selengkapnya tentang jenis notebook yang didukung di Azure Databricks, baca Mengekspor dan mengimpor notebook Databricks.
Mengelola penerapan output buku catatan IPYNB
Untuk notebook IPYNB di folder yang dikontrol sumber, Anda dapat mengelola bagaimana output buku catatan berkomitmen pada repositori jarak jauh.
Izinkan penerapan output buku catatan .ipynb
Hasil keluaran hanya dapat dikomitmenkan jika administrator ruang kerja telah mengaktifkan fitur ini. Secara bawaan, pengaturan administratif untuk folder Git tidak mengizinkan output buku catatan .ipynb
untuk di-commit. Jika Anda memiliki hak istimewa administrator untuk ruang kerja, Anda dapat mengubah pengaturan ini:
Buka pengaturan admin >pengaturan Ruang Kerja di konsol administrator Azure Databricks.
Di bawah folder Git , pilih Izinkan folder Git mengekspor output IPYNB lalu pilih Izinkan: output IPYNB dapat diaktifkan pada.
Penting
Saat output disertakan, visualisasi dan konfigurasi dasbor disertakan dalam buku catatan.ipynb
yang Anda buat.
Mengontrol penerapan artefak output notebook IPYNB
Saat Anda menerapkan file .ipynb
, Databricks membuat file konfigurasi yang memungkinkan Anda mengontrol bagaimana Anda menerapkan output: .databricks/commit_outputs
.
Jika Anda memiliki file buku catatan
tetapi tidak ada file konfigurasi di repositori jarak jauh Anda, buka dialog Status Git . Dalam dialog pemberitahuan, pilih Buat file commit_outputs.
Anda juga dapat membuat file konfigurasi dari menu File
Di menu File
, pilih Terapkan output buku catatan. editor buku catatan
Dalam kotak dialog, konfirmasikan pilihan Anda untuk mengonfirmasi hasil buku catatan.