Apa itu Aplikasi Databricks?
Penting
Aplikasi Databricks ada di Pratinjau Umum.
Databricks Apps memungkinkan pengembang membuat data dan aplikasi AI yang aman di platform Databricks dan berbagi aplikasi tersebut dengan pengguna.
Sebelumnya, membuat data dan aplikasi AI yang menggunakan data yang dikelola oleh ruang kerja Databricks dan fitur analitik data platform Databricks diperlukan penyebaran infrastruktur terpisah untuk menghosting aplikasi, memastikan kepatuhan terhadap kontrol tata kelola data, mengelola keamanan aplikasi, termasuk autentikasi dan otorisasi, dan sebagainya. Dengan Databricks Apps, Databricks menghosting aplikasi Anda, sehingga Anda tidak perlu mengonfigurasi atau menyebarkan infrastruktur tambahan.
Aplikasi Anda dapat menggunakan sumber daya dan fitur platform Databricks, termasuk Unity Catalog untuk tata kelola, Databricks SQL untuk mengkueri data, fitur AI seperti penyajian model, Pekerjaan Databricks untuk ETL, dan aturan keamanan yang sudah dikonfigurasi di ruang kerja, termasuk aturan yang mengontrol akses ke data yang digunakan oleh aplikasi Anda. Autentikasi dan otorisasi menggunakan fungsionalitas Azure Databricks yang ada, termasuk OAuth dan perwakilan layanan.
Databricks merancang Aplikasi Databricks untuk pengembang. Anda mengembangkan aplikasi di Python menggunakan kerangka kerja apa pun seperti Dash, Streamlit, atau Gradio. Karena aplikasi Anda portabel, Anda dapat membuat dan men-debugnya secara lokal, menyebarkannya ke ruang kerja Databricks, lalu memindahkannya ke ruang kerja lain.
Persyaratan
Persyaratan ruang kerja
Untuk menyebarkan dan menjalankan aplikasi di ruang kerja Azure Databricks Anda, ruang kerja harus memenuhi persyaratan berikut:
- Anda harus memastikan bahwa firewall Anda tidak memblokir domain
*.databricksapps.com
. - Ruang kerja Databricks Anda harus berada di wilayah yang didukung. Lihat ketersediaan fitur tanpa server.
Persyaratan lingkungan pengembangan
Untuk membuat aplikasi secara lokal dan menyebarkan aplikasi tersebut ke ruang kerja Azure Databricks Anda, lingkungan pengembangan Anda harus memenuhi persyaratan berikut:
Python 3.11 atau lebih tinggi.
Antarmuka baris perintah Databricks (Databricks CLI), versi v0.229.0 atau lebih tinggi, dikonfigurasi untuk mengakses ruang kerja Databricks Anda. Untuk menginstal atau memperbarui dan mengonfigurasi Databricks CLI, lihat Menginstal atau memperbarui Databricks CLI dan Autentikasi untuk Databricks CLI.
Databricks SDK untuk Python. Anda dapat menginstal SDK dengan
pip3
:pip3 install databricks-sdk
Lihat Databricks SDK untuk Python.
(Opsional) Jika aplikasi Anda perlu mengakses Databricks SQL, instal Konektor SQL Databricks untuk Python. Anda dapat menginstal konektor dengan
pip3
:pip3 install databricks-sql-connector
Di mana saya dapat mengembangkan aplikasi Databricks?
Anda dapat menulis dan menguji aplikasi di IDE apa pun yang mendukung Python, seperti PyCharm, IntelliJ IDEA, atau Visual Studio Code. Databricks merekomendasikan untuk mengembangkan aplikasi Anda menggunakan Visual Studio Code dan ekstensi Databricks untuk Visual Studio Code, tetapi Anda juga dapat menggunakan notebook Databricks dan editor file untuk mengedit kode Anda langsung di ruang kerja Databricks Anda.
Bagaimana cara mengembangkan dan menyebarkan aplikasi Databricks?
Untuk mengembangkan aplikasi secara lokal, berikut ini adalah alur kerja umum:
- Kembangkan aplikasi Anda di IDE pilihan Anda seperti Visual Studio Code.
- Jalankan aplikasi Anda secara lokal di baris perintah dan lihat di browser Anda.
- Ketika kode selesai dan diuji, pindahkan kode dan artefak yang diperlukan ke ruang kerja Databricks Anda.
Lihat Mulailah menggunakan Aplikasi Databricks.
Untuk membuat aplikasi di UI atau menggunakan contoh bawaan, lihat Bagaimana cara membuat aplikasi di UI Aplikasi Databricks?.
Dapatkah saya menggunakan kerangka kerja Python dengan aplikasi Databricks saya?
Anda dapat mengembangkan aplikasi menggunakan kerangka kerja Python favorit Anda, seperti Dash, Streamlit, atau Gradio. Anda dapat melihat contoh yang menggunakan kerangka kerja Python populer di antarmuka pengguna Aplikasi Databricks. Lihat Bagaimana cara membuat aplikasi di UI Aplikasi Databricks?.
Bagaimana Aplikasi Databricks mengelola otorisasi?
Model otorisasi Aplikasi Databricks mencakup pengguna yang mengakses aplikasi dan perwakilan layanan terkelola Azure Databricks yang ditetapkan ke aplikasi:
Untuk mengakses aplikasi, pengguna harus memiliki izin CAN_USE atau CAN_MANAGE di aplikasi. Untuk mempelajari selengkapnya tentang menetapkan izin ke aplikasi, lihat Mengonfigurasi izin untuk aplikasi Databricks Anda.
Saat aplikasi dibuat, Databricks Apps secara otomatis membuat perwakilan layanan terkelola Azure Databricks dan menetapkan perwakilan layanan tersebut ke aplikasi. Perwakilan layanan ini hanya memiliki akses ke ruang kerja tempat aplikasi dibuat dan digunakan untuk mengautentikasi dan mengotorisasi akses ke sumber daya di ruang kerja, seperti gudang SQL, model yang melayani titik akhir, atau objek yang dapat diamankan di Katalog Unity. Semua akses oleh aplikasi ke data atau sumber daya ruang kerja lainnya dilakukan atas nama perwakilan layanan, bukan pemilik atau pengguna aplikasi.
Aplikasi Databricks secara otomatis memberikan izin perwakilan layanan ke sumber daya apa pun yang ditetapkan ke aplikasi jika pengguna yang menyebarkan aplikasi memiliki
CAN MANAGE
izin pada sumber daya tersebut. Jika akses oleh perwakilan layanan ke sumber daya lain diperlukan, misalnya, tabel atau file ruang kerja, admin akun atau ruang kerja harus memberikan akses perwakilan layanan ke sumber daya tersebut. Saat memberikan akses ke sumber daya, Databricks merekomendasikan untuk mengikuti prinsip hak istimewa paling sedikit dan memberikan perwakilan layanan hanya izin minimal yang diperlukan. Lihat Mengelola prinsipal layanan.Nama perwakilan layanan dapat ditemukan di halaman detail aplikasi di kartu Sumber daya aplikasi. Perwakilan layanan menyertakan nama aplikasi, misalnya, untuk aplikasi bernama
my-hello-world-app
, nama perwakilan layanan adalahapp-22ixod my-hello-world-app
.
Siapa yang dapat membuat aplikasi Databricks?
Setiap pengguna di ruang kerja dapat membuat aplikasi. Namun, untuk mengelola izin perwakilan layanan yang ditetapkan ke aplikasi, Anda harus menjadi admin akun atau ruang kerja.
Bagaimana cara mengonfigurasi aplikasi Databricks saya?
Aplikasi Databricks secara otomatis mengatur beberapa variabel lingkungan yang dapat diakses aplikasi Anda, seperti host Databricks tempat aplikasi Anda berjalan. Anda juga dapat mengatur parameter kustom menggunakan file YAML. Lihat Konfigurasi Aplikasi Databricks.
Bagaimana cara mengintegrasikan aplikasi Databricks saya dengan layanan Azure Databricks?
Aplikasi Anda dapat menggunakan fitur platform Databricks seperti Databricks SQL untuk mengkueri data, Pekerjaan Databricks untuk penyerapan dan pemrosesan data, Model AI Mosaik Melayani untuk mengakses model AI generatif, dan rahasia Databricks untuk mengelola informasi sensitif. Saat mengonfigurasi aplikasi Anda, fitur platform Databricks ini disebut sebagai sumber daya.
Namun, karena aplikasi dirancang agar portabel, Databricks merekomendasikan agar aplikasi tidak bergantung pada sumber daya tertentu. Misalnya, aplikasi Anda tidak boleh dikodekan secara permanen untuk menggunakan gudang SQL tertentu. Sebagai gantinya, konfigurasikan gudang SQL di antarmuka pengguna Aplikasi Databricks saat membuat atau memperbarui aplikasi.
Selain itu, karena aplikasi dikonfigurasi untuk berjalan dengan hak istimewa yang paling tidak diperlukan, aplikasi tersebut tidak boleh membuat sumber daya baru. Sebaliknya, mereka harus mengandalkan platform Databricks untuk menyelesaikan layanan dependen yang ada. Setiap aplikasi memiliki perwakilan layanan Databricks yang ditetapkan. Selama pembuatan atau pembaruan aplikasi, perwakilan layanan diberikan izin yang diperlukan pada dependensi sumber daya yang ditentukan.
Untuk mempelajari selengkapnya tentang menambahkan fitur platform Databricks sebagai sumber daya aplikasi, lihat Menetapkan fitur platform Databricks ke aplikasi Databricks.
Di mana saya dapat menemukan log audit untuk aplikasi Databricks saya?
Untuk menemukan peristiwa audit untuk aplikasi, gunakan tabel sistem Azure Databricks. Anda bisa menggunakan tabel sistem untuk mengkueri:
- Masuk ke aplikasi. Lihat Pengguna mana yang telah masuk ke aplikasi Databricks?.
- Izin atau berbagi perubahan pada aplikasi. Lihat Aplikasi Databricks mana yang telah diperbarui untuk mengubah cara aplikasi dibagikan dengan pengguna atau grup lain?.
Berapa biaya untuk Aplikasi Databricks?
Untuk informasi tentang harga Untuk Aplikasi Databricks, lihat Komputasi untuk Aplikasi.
Lingkungan sistem Databricks Apps
Catatan
Untuk melihat lingkungan untuk aplikasi tertentu, termasuk variabel lingkungan dan paket yang diinstal, buka tab Lingkungan di halaman detail untuk aplikasi. Lihat Menampilkan detail untuk aplikasi Databricks.
Berikut ini menjelaskan lingkungan sistem tempat aplikasi Anda berjalan, sumber daya tersedia untuk aplikasi Anda, dan versi aplikasi dan pustaka yang diinstal.
- Sistem Operasi: Ubuntu 22.04 LTS
-
Python: 3.11.0. Aplikasi Anda berjalan di lingkungan virtual Python. Semua dependensi diinstal di lingkungan virtual ini, termasuk pustaka yang diinstal secara otomatis dan pustaka apa pun yang Anda instal, misalnya, dengan
requirements.txt
file. - Sumber daya sistem: Aplikasi Anda dapat menggunakan hingga dua CPU virtual (vCPU) dan memori 6 GB. Aplikasi Anda mungkin dimulai ulang jika melebihi sumber daya yang dialokasikan.
Pustaka Python terinstal
Pustaka | Versi |
---|---|
databricks-sql-connector | 3.4.0 |
databricks-sdk | 0.33.0 |
mlflow-skinny | 2.16.2 |
gradio | 4.44.0 |
streamlit | 1.38.0 |
shiny | 1.1.0 |
Dash | 2.18.1 |
Labu | 3.0.3 |
fastapi | 0.115.0 |
uvicorn[standard] | 0.30.6 |
gunicorn==19.9.0 | 23.0.0 |
dash-ag-grid | 31.2.0 |
komponen dash-mantine | 0.14.4 |
dash-bootstrap-components | 1.6.0 |
plotly | 5.24.1 |
plotly-resampler | 0.10.0 |
Batasan
Ada batas 50 aplikasi di ruang kerja Databricks.
File yang digunakan oleh aplikasi tidak boleh melebihi ukuran 10 MB. Jika file di direktori aplikasi Anda melebihi batas ini, penyebaran aplikasi gagal dengan kesalahan.
Aplikasi Databricks tidak memenuhi standar kepatuhan HIPAA, PCI, atau FedRAMP.
Log yang dibuat oleh aplikasi tidak bertahan saat komputasi Azure Databricks yang menghosting aplikasi dihentikan. Lihat Pengelogan dari aplikasi Databricks Anda.
Karena tidak mendukung OAuth, Anda tidak dapat menggunakan URL regional warisan dengan Aplikasi Databricks.