Bagikan melalui


Alat pengembangan lokal

Databricks menyediakan ekosistem alat untuk membantu Anda mengembangkan aplikasi dan solusi yang terintegrasi dengan Azure Databricks dan mengelola sumber daya dan data Databricks secara terprogram.

Artikel ini memberikan gambaran umum tentang alat dan rekomendasi ini untuk alat terbaik untuk skenario pengembang umum.

Alat apa yang disediakan Databricks untuk berkembang secara lokal?

Tabel berikut ini menyediakan daftar alat pengembang yang disediakan oleh Databricks.

Alat Deskripsi
Autentikasi dan Otorisasi Konfigurasikan autentikasi dan otorisasi untuk alat, skrip, dan aplikasi Anda agar berfungsi dengan Azure Databricks.
Databricks Connect Sambungkan ke Azure Databricks menggunakan lingkungan pengembangan terintegrasi (IDEs) populer seperti PyCharm, IntelliJ IDEA, Eclipse, RStudio, dan JupyterLab.
Jika Anda menggunakan Visual Studio Code, Databricks merekomendasikan ekstensi Databricks untuk Visual Studio Code, yang dibangun di atas Databricks Connect, karena menyediakan fitur tambahan untuk mengaktifkan konfigurasi yang lebih mudah.
Ekstensi Databricks untuk Visual Studio Code Sambungkan ke ruang kerja Azure Databricks jarak jauh Anda dari lingkungan pengembangan terintegrasi (IDE) Visual Studio Code .
Plugin PyCharm Databricks Konfigurasikan koneksi ke ruang kerja Databricks jarak jauh dan jalankan file pada kluster Databricks dari PyCharm. Plugin ini dikembangkan dan disediakan oleh JetBrains dalam kemitraan dengan Databricks.
SDK Databricks Mengotomatiskan Azure Databricks dari pustaka kode yang ditulis untuk bahasa populer seperti Python, Java, Go, dan R. Alih-alih mengirim panggilan REST API secara langsung menggunakan curl/ Postman, Anda dapat menggunakan SDK untuk berinteraksi dengan Databricks menggunakan bahasa pemrograman pilihan Anda. SDK Databricks mendukung REST API lengkap dan menyediakan fitur lain, termasuk autentikasi terpadu dan penomoran halaman, yang membuatnya mudah digunakan dan diperluas untuk mencakup banyak skenario.
Driver dan alat SQL Sambungkan ke Azure Databricks untuk menjalankan perintah dan skrip SQL, berinteraksi secara terprogram dengan Azure Databricks, dan mengintegrasikan fungsionalitas Azure Databricks SQL ke dalam aplikasi yang ditulis dalam bahasa populer seperti Python, Go, JavaScript, dan TypeScript.
Databricks CLI Akses fungsionalitas Azure Databricks menggunakan antarmuka baris perintah (CLI) Databricks. CLI membungkus Databricks REST API, jadi alih-alih mengirim panggilan REST API secara langsung menggunakan curl atau Postman, Anda dapat menggunakan Databricks CLI untuk berinteraksi dengan Databricks.
Kumpulan Aset Databricks Terapkan praktik terbaik pengembangan, pengujian, dan penyebaran standar industri (CI/CD) untuk data Azure Databricks dan proyek AI Anda menggunakan Bundel Aset Databricks (DAB).
Penyedia Databricks Terraform dan Terraform CDKTF untuk Databricks Memprovisikan infrastruktur dan sumber daya Azure Databricks menggunakan Terraform.
Alat CI/CD Integrasikan sistem dan kerangka kerja CI/CD populer seperti GitHub Actions, Jenkins, dan Apache Airflow.

Tip

Anda juga dapat menghubungkan banyak alat pihak ketiga populer tambahan ke kluster dan gudang SQL untuk mengakses data di Azure Databricks. Lihat Mitra Teknologi.

Alat pengembang mana yang harus saya gunakan?

Tabel berikut menguraikan rekomendasi alat Databricks untuk skenario pengembang umum.

Alat Rekomendasi penggunaan
Ekstensi Databricks untuk Visual Studio Code
Plugin PyCharm Databricks
Untuk IDE yang lain, gunakan Databricks CLI dengan Databricks Connect
  • Pengembangan dan debugging interaktif dari IDE lokal
Databricks CLI
  • Interaksi langsung dengan Databricks dari baris perintah
  • Pembuatan skrip shell
  • Eksperimen
  • Memanggil REST API secara langsung
  • Mengelola profil autentikasi lokal
  • Menyinkronkan kode dari IDE ke ruang kerja Databricks
Paket Aset Databricks (sebuah fitur dari CLI)
  • Mengelola alur kerja dan menyebarkan proyek ke Databricks
  • Menerapkan praktik terbaik CI/CD
  • Versi bersama, penulis bersama, dan menyebarkan bersama sumber daya serta aset Anda sebagai satu kesatuan.
  • Mendukung sumber daya yang paling umum
Penyedia Databricks Terraform
  • Infrastruktur sebagai kode, CI/CD
  • Mengelola dan membuat ruang kerja, katalog, metastores, dan menerapkan izin
  • Menjamin portabilitas lingkungan dan pemulihan bencana
  • Banyak sumber daya yang didukung
Databricks Python SDK
Databricks Java SDK
Databricks Go SDK
Databricks R SDK
  • Pengembangan aplikasi
  • Integrasikan dengan sistem penyebaran yang ada
  • Membuat alur kerja Databricks kustom dan layanan web baru
Databricks REST API
  • Mengotomatiskan proses di mana SDK dalam bahasa pemrograman pilihan Anda tidak tersedia
  • Skenario tingkat lanjut saja
  • Hampir semua sumber daya Databricks tersedia