Menjalankan buku catatan di ruang bersih
Artikel ini menjelaskan cara menjalankan buku catatan di ruang bersih. Notebook adalah antarmuka yang digunakan kolaborator untuk menjalankan analisis data dalam kolaborasi.
Untuk mempelajari cara menambahkan buku catatan ke ruang yang bersih, lihat Membuat ruang bersih.
Sebelum Anda mulai
Untuk menjalankan buku catatan di ruangan yang bersih, Anda harus:
- Pemilik kamar bersih atau memiliki
EXECUTE CLEAN ROOM TASK
hak istimewa di kamar yang bersih. - Kolaborator yang tidak membuat buku catatan. Pembuat buku catatan tidak dapat menjalankan buku catatan. Ini memberlakukan persetujuan implisit dari notebook oleh kedua belah pihak.
Catatan
Pembuat secara otomatis ditetapkan sebagai pemilik ruang bersih di akun Databricks mereka. Admin metastore organisasi kolaborator secara otomatis diberi kepemilikan ruang bersih di akun Databricks mereka. Anda dapat mentransfer kepemilikan. Lihat Mengelola kepemilikan objek Katalog Unity.
Menjalankan buku catatan di ruangan yang bersih
Untuk menjalankan buku catatan di ruang bersih, Anda harus menggunakan Catalog Explorer.
Di ruang kerja Azure Databricks Anda, klik ikon Katalog
Katalog.
Di bagian atas panel Katalog
, klik ikon gerigi dan pilihRuang Bersih .Atau, dari halaman Akses cepat, klik tombol Bersihkan Ruangan > .
Pilih ruang bersih dari daftar.
Di bawah Buku Catatan, klik buku catatan untuk membukanya dalam mode pratinjau.
Klik tombol Jalankan .
Anda hanya bisa menjalankan buku catatan yang dibagikan kolaborator lain.
(Opsional) Pada dialog Jalankan buku catatan dengan parameter, klik + Tambahkan untuk meneruskan parameter ke tugas buku catatan.
Klik kotak centang konfirmasi.
Klik Jalankan.
Klik Lihat detail untuk melihat kemajuan eksekusi.
Atau, Anda dapat melihat kemajuan eksekusi dengan masuk ke Berjalan di halaman ini atau dengan mengklik Alur Kerja di bar samping ruang kerja dan masuk ke tab Eksekusi pekerjaan.
Menampilkan hasil eksekusi buku catatan.
Hasil notebook muncul setelah eksekusi selesai. Untuk melihat eksekusi sebelumnya, buka Eksekusi dan klik tautan di kolom Waktu mulai.
Catatan
Parameter cr_creator_input_catalog
dan cr_collaborator_input_catalog
secara otomatis diteruskan ke buku catatan ruang bersih saat runtime. Anda dapat menggunakan parameter ini untuk pengujian lokal dengan tabel sampel. Untuk informasi selengkapnya tentang parameter untuk tugas pekerjaan, lihat Parameterisasi pekerjaan.
Berbagi output notebook menggunakan tabel output
Tabel output adalah tabel bersifat baca-saja sementara yang dihasilkan oleh pelaksanaan buku catatan dan dibagikan ke metastore pemroses buku catatan. Jika buku catatan membuat tabel output, pengelola buku catatan dapat mengaksesnya di dalam katalog output dan membagikannya dengan pengguna lain di ruang kerja mereka. Lihat Membuat dan bekerja dengan tabel output di Databricks Clean Rooms.
Menggunakan Alur Kerja Azure Databricks untuk menjalankan buku catatan ruangan yang bersih
Anda dapat menggunakan pekerjaan Azure Databricks untuk menjalankan notebook dan melakukan tugas pada tabel output, memungkinkan Anda membangun alur kerja kompleks yang melibatkan aset kamar bersih Anda. Fitur-fitur ini khususnya memungkinkan alur kerja tersebut:
- Tipe tugas notebook Clean Room memungkinkan Anda memilih dan menjalankan buku catatan ruang bersih sebagai tugas Alur Kerja. Lihat Tugas buku catatan Clean Room untuk pekerjaan.
- Eksekusi buku catatan yang dipicu oleh alur kerja dapat menghasilkan tabel output yang dapat dirujuk oleh tugas alur kerja lainnya. Lihat Membuat dan bekerja dengan tabel output di Databricks Clean Rooms.
- Alur kerja dapat menggunakan nilai tugas yang meneruskan nilai parameter pekerjaan ke buku catatan clean room atau menangkap output buku catatan clean room tersebut dan meneruskan output tersebut ke tugas alur kerja lainnya. Lihat Menggunakan nilai tugas untuk meneruskan informasi antar tugas.
- Nama skema output ruang bersih dibuat secara otomatis. Jika Anda menyertakan
{{tasks.<your_task_name>.output.schema_name}}
dan{{tasks.<your_task_name>.output.catalog_name}}
dalam parameter, Anda dapat mereferensikan nilai tersebut dari ruang bersih saat dijalankan dalam tugas buku catatan hilir. Buka tugas buku catatan, dan di bawah parameter , pilih nilai Anda.
Misalnya, Anda dapat membuat alur kerja yang menyebarluaskan nama skema output yang dihasilkan secara dinamis di seluruh tugas, dengan melakukan hal berikut:
Buat tugas tipe tugas Bersihkan buku catatan Ruangan yang menjalankan buku catatan yang menyertakan pengaturan nilai tugas berikut ini:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
Buat tugas berikutnya yang mereferensikan
output_schema
nilai untuk memproses output.