Mengonfigurasi dan mengedit tugas Databricks
Artikel ini berfokus pada instruksi untuk membuat, mengonfigurasi, dan mengedit tugas menggunakan UI ruang kerja Alur Kerja.
Azure Databricks mengelola tugas sebagai komponen Pekerjaan Databricks. Pekerjaan memiliki satu atau beberapa tugas. Anda membuat pekerjaan baru di UI ruang kerja dengan mengonfigurasi tugas pertama. Untuk mengonfigurasi pekerjaan baru, lihat Mengonfigurasi dan mengedit Pekerjaan Databricks.
Setiap tugas memiliki sumber daya komputasi terkait yang menjalankan logika tugas. Jika Anda menggunakan tanpa server, Azure Databricks mengonfigurasi sumber daya komputasi Anda. Jika Anda tidak menggunakan tanpa server, lihat Mengonfigurasi komputasi untuk pekerjaan.
Azure Databricks memiliki titik masuk dan alat lain untuk konfigurasi tugas, termasuk yang berikut ini:
- Referensi REST API Pekerjaan
- Apa itu Databricks CLI?
- Membuat dan mengelola pekerjaan buku catatan terjadwal
Membuat atau mengonfigurasi tugas
Untuk mengedit tugas yang sudah ada atau menambahkan tugas baru dengan UI ruang kerja, lakukan select pada tugas yang sudah ada dengan mengikuti langkah-langkah berikut:
- Klik
Alur Kerja di bilah samping.
- Pada Nama dicolumn, klik nama pekerjaan.
- Klik tab Tugas . Grafik tugas muncul.
- Untuk mengedit tugas, klik nama tugas. Konfigurasi tugas muncul di bawah grafik tugas.
- Untuk menambahkan tugas, klik
.
Jenis tugas
Opsi dan instruksi konfigurasi bervariasi menurut tugas. Jenis tugas berikut ini tersedia:
- Notebook
- Skrip Python
- Roda Python
- SQL
- Alur DLT
- dbt
- JAR
- Spark Submit
- Jalankan Pekerjaan
- Jika/lainnya
- Untuk masing-masing
Mengkloning tugas
Kloning tugas untuk menyalin semua konfigurasi tugas yang ada, termasuk dependensi upstram.
Untuk mengkloning tugas, lakukan hal berikut:
- Select tugas dalam grafik tugas.
- Klik
.
- Tentukan nama tugas Kloning dan klik Kloning.
Menghapus tugas
Untuk menghapus tugas, lakukan hal berikut:
- Select tugas dalam grafik tugas.
- Klik
dan selectHapus tugas.
Menyalin jalur tugas
Jenis tugas tertentu, misalnya, tugas buku catatan, memungkinkan Anda menyalin jalur ke kode sumber tugas:
- Klik tab Tugas.
- Select tugas yang berisi jalur yang harus disalin.
- Klik
di samping jalur tugas untuk menyalin jalur ke clipboard.
Pengaturan tugas tingkat lanjut
Kontrol pengaturan tingkat lanjut berikut mencoba kembali tugas yang gagal dan kebijakan waktu habis untuk tugas yang tidak responsif.
Catatan
Anda dapat set pemberitahuan pada tingkat tugas atau pekerjaan. Lihat Tambah pemberitahuan pada pekerjaan.
Set kebijakan pengulangan
Pengaturan default untuk percobaan ulang tugas bergantung pada konfigurasi pekerjaan. Untuk sebagian besar konfigurasi, pengaturan default tidak mencoba kembali tugas apa pun pada kegagalan tugas.
Pekerjaan tanpa serveroptimize mengulangi secara default. Lihat Mengonfigurasi pengoptimalan otomatis komputasi tanpa server untuk melarang percobaan ulang
Pekerjaan berkelanjutan menggunakan kebijakan coba lagi backoff eksponensial. Lihat Bagaimana kegagalan ditangani untuk pekerjaan berkelanjutan?.
Untuk mengonfigurasi kebijakan yang menentukan kapan dan berapa kali eksekusi tugas yang gagal dicoba kembali, klik + Tambahkan di samping Coba Lagi.
Interval coba lagi dihitung dalam milidetik antara awal eksekusi yang gagal dan eksekusi coba lagi berikutnya.
Catatan
Jika Anda mengonfigurasi Waktu Habis dan Percobaan Kembali, waktu habis berlaku untuk setiap percobaan kembali.
Mengonfigurasi ambang batas untuk durasi eksekusi tugas atau metrik backlog streaming
Anda dapat mengonfigurasi ambang opsional untuk durasi eksekusi tugas atau streaming metrik backlog. Untuk mengonfigurasi ambang batas durasi atau ambang batas metrik streaming, klik ambang batas metrik di panel konfigurasi tugas.
Untuk mengonfigurasi ambang batas durasi tugas, termasuk durasi penyelesaian yang diharapkan dan maksimum untuk tugas, selectDurasi Pelaksanaan di menu drop-down Metrik . Masukkan durasi di bidang Peringatan untuk mengonfigurasi waktu penyelesaian tugas yang diharapkan. Jika tugas berjalan melebihi ambang batas ini, peristiwa akan dipicu. Untuk mengonfigurasi waktu penyelesaian maksimum untuk tugas, masukkan durasi maksimum di bidang Batas Waktu . Jika tugas tidak selesai dalam waktu ini, Azure Databricks mengatur statusnya menjadi "Kehabisan Waktu".
Untuk mengonfigurasi ambang batas metrik backlog streaming,
Masukkan durasi di bidang Peringatan untuk mengonfigurasi waktu penyelesaian tugas yang diharapkan. Jika tugas melebihi ambang batas ini, peristiwa akan dipicu. Anda dapat menggunakan kejadian ini untuk memberi tahu ketika tugas berjalan lambat. Lihat Konfigurasikan pemberitahuan untuk tugas yang lambat.
Untuk mengonfigurasi waktu penyelesaian maksimum untuk tugas, masukkan durasi maksimum di bidang Batas Waktu . Jika tugas tidak selesai dalam waktu ini, Azure Databricks mengatur statusnya menjadi "Kehabisan Waktu".
Jika peristiwa dipicu karena ambang terlampaui, Anda dapat menggunakan peristiwa untuk mengirim pemberitahuan. Lihat Konfigurasikan pemberitahuan untuk tugas yang lambat.