Menyambungkan Power BI ke Azure Databricks
Microsoft Power BI adalah layanan analisis bisnis yang menyediakan visualisasi interaktif dengan kemampuan intelijen bisnis swalayan, memungkinkan pengguna akhir untuk membuat laporan dan dasbor sendiri tanpa harus bergantung pada staf teknologi informasi atau administrator database.
Saat Anda menggunakan Azure Databricks sebagai sumber data dengan Power BI, Anda dapat membawa keunggulan kinerja dan teknologi Azure Databricks melebihi ilmuwan data dan insinyur data ke semua pengguna bisnis.
Menerbitkan ke Power BI Online dari Azure Databricks
Saat menggunakan Azure Databricks sebagai sumber data dengan Power BI Online, Anda bisa membuat himpunan data Power BI dari tabel atau skema langsung dari UI Databricks.
Persyaratan
Data Anda harus berada di Katalog Unity, dan komputasi (kluster) Anda harus mengaktifkan Katalog Unity. Metastore Apache Hive saat ini tidak didukung.
Anda harus memiliki lisensi Power BI premium (kapasitas premium atau premium per pengguna).
Anda harus memberikan izin berikut ke aplikasi ID Entra terdaftar, Integrasi Penerbitan Himpunan Data Databricks, yang Anda gunakan untuk menerbitkan dari Databricks ke Power BI:
Content.Create
Himpunan Data.ReadWrite.All
Workspace.Read.All
Untuk informasi selengkapnya, lihat Izin Microsoft Entra.
Catatan
Persetujuan Admin Entra biasanya diperlukan untuk izin ini, terutama untuk ruang kerja dan akses tingkat himpunan data di Power BI. Lihat Meninjau permintaan persetujuan admin untuk instruksi.
Anda harus mengaktifkan Baca Tulis untuk Titik Akhir XMLA dalam kapasitas Power BI Anda. Ikuti tautan ini untuk instruksi.
Jika pengguna ingin mengedit model semantik di Layanan Power BI setelah penerbitan, Anda harus mengaktifkan Pengguna dapat mengedit model data di layanan Power BI (pratinjau) di pengaturan ruang kerja. Anda juga dapat mengedit Model Semantik menggunakan Editor Tabular dengan membuat koneksi menggunakan titik akhir XMLA.
Jika ruang kerja Power BI Anda menggunakan tautan privat, Anda harus memperbarui kredensial sumber data himpunan data secara manual di Power BI.
Menerbitkan tabel Azure Databricks ke himpunan data Power BI
Masuk ke ruang kerja Databricks Anda dan klik
Katalog di bar samping untuk membuka Catalog Explorer.
Pilih sumber daya komputasi dari daftar drop-down di kanan atas.
Buka katalog dan pilih skema atau tabel yang akan diterbitkan. Jangan pilih dari metastore apache hive atau katalog sampel.
Di kanan atas, klik Gunakan dengan alat BI untuk skema atau Buka di dasbor untuk tabel.
Pilih Terbitkan ke ruang kerja Power BI.
Dalam dialog Sambungkan ke mitra, klik Sambungkan ke ID Microsoft Entra untuk mengautentikasi.
Di ruang kerja Power BI, pilih ruang kerja Power BI.
Dalam Mode Himpunan Data, pilih DirectQuery atau Impor.
Di Metode Autentikasi di Power BI, pilih OAuth atau PAT (Token Akses Pribadi).
Databricks merekomendasikan penggunaan OAuth karena memungkinkan kontrol akses menenangkan dan audit tingkat pengguna. Kredensial OAuth mungkin perlu dikonfigurasi pada halaman pengaturan himpunan data Power BI di bawah Kredensial sumber data. Jika Anda memilih Token Akses Pribadi (PAT), PAT dibuat atas nama Anda untuk memungkinkan Power BI mengakses model semantik.
Di Nama Himpunan Data, pilih Terbitkan sebagai himpunan data baru atau Gunakan himpunan data yang sudah ada.
Saat Anda memilih Gunakan himpunan data yang sudah ada, berikut ini benar:
- Jika himpunan data ada, himpunan data tidak ditimpa. Pembaruan hanya menambahkan rekaman baru dalam skema tertentu.
- Jika tabel yang dipilih bukan bagian dari himpunan data yang ada, maka akan ditambahkan.
- Jika tabel sudah ada di himpunan data Anda dan kolom baru ditambahkan setelah pembaruan terakhir, kolom tersebut akan ditambahkan secara otomatis.
- Anda dapat memilih model penyimpanan yang berbeda untuk tabel baru untuk membuat model semantik komposit.
Jika Anda memiliki model semantik yang sudah ada yang ingin Anda perbarui saat Anda menyimpan koneksi data yang ada, pilih Gunakan himpunan data yang sudah ada. Jika Anda ingin membuat himpunan data baru dengan model semantik baru, pilih Terbitkan sebagai himpunan data baru.
- Jika himpunan data ada, himpunan data tidak ditimpa. Pembaruan hanya menambahkan rekaman baru dalam skema tertentu.
Klik Terbitkan ke Power BI.
Dalam 10 hingga 20 detik saat himpunan data diterbitkan, klik Buka Power BI untuk membuka himpunan data Power BI Anda di tab baru.
Fitur dan catatan
- Saat menerbitkan skema yang berisi beberapa tabel, semua tabel dengan kolom diterbitkan. Tabel tanpa kolom tidak diterbitkan.
- Komentar pada kolom tabel di Azure Databricks disalin ke deskripsi kolom terkait di Power BI.
- Hubungan kunci asing dipertahankan dalam himpunan data yang diterbitkan. Namun, Power BI hanya mendukung satu jalur hubungan aktif antara dua tabel apa pun. Saat beberapa jalur ada dalam skema di Azure Databricks, beberapa hubungan terkait di Power BI diatur ke tidak aktif. Nantinya Anda dapat mengubah hubungan mana yang aktif atau tidak aktif dalam tampilan model data di Power BI.
- Saat menggunakan OAuth atau gateway data lokal, kredensial mungkin perlu dikonfigurasi di bawah "Kredensial sumber data" di halaman pengaturan himpunan data Power BI.
- Saat ini, pengguna hanya dapat menerbitkan langsung ke ruang kerja Power BI di penyewa rumah mereka. Penerbitan di penyewa di mana mereka adalah pengguna tamu tidak didukung.
Pemecahan Masalah
Kesalahan | Catatan |
---|---|
"Persetujuan diperlukan" saat meluncurkan Terbitkan ke Power BI untuk pertama kalinya | Jika Anda melihat pesan ini, Anda memerlukan persetujuan Admin Entra sebelum dapat memberikan izin ke fitur integrasi ini. Hubungi Admin Entra Anda untuk menyetujui permintaan. Ikuti tautan ini untuk instruksi. |
PowerBINotLicensedException | Pastikan Anda memiliki lisensi Power BI Premium. |
Kami tidak dapat menyebarkan himpunan data ini. Hubungi administrator kapasitas untuk memastikan dukungan baca/tulis XMLA diaktifkan dalam pengaturan kapasitas pada kapasitas Power BI Premium, lalu coba lagi. Untuk informasi tambahan, lihat 'DUKUNGAN baca/tulis XMLA' dalam dokumentasi produk. | Hubungi administrator kapasitas Power BI Anda untuk mengaktifkan kemampuan Baca dan Tulis di bawah titik akhir XMLA di pengaturan kapasitas. Ikuti tautan ini untuk instruksi. |
Fitur titik akhir XMLA dinonaktifkan. Aktifkan Fitur Analisis di Excel di PowerBI.com untuk mengaktifkan fitur ini. | Hubungi administrator kapasitas Power BI Anda untuk mengaktifkan kemampuan Baca dan Tulis di bawah titik akhir XMLA di pengaturan kapasitas. Ikuti tautan ini untuk instruksi. |
CapacityNotActive | Kapasitas Anda mungkin dijeda. Hubungi administrator kapasitas Anda untuk memeriksa status kapasitas. |
Database dengan nama '<ccon> ***</ccon> ' sudah ada di '<ccon> ruang </ccon> kerja ' ***. |
Pastikan Anda memiliki izin untuk membuat model semantik. Kemudian, coba lagi Terbitkan ke Power BI untuk menerbitkan model semantik dengan nomor versi bertahap. |
Anda tidak dapat menggunakan mode Direct Lake bersama dengan mode penyimpanan lain dalam model yang sama. Model komposit tidak mendukung mode Direct Lake. Hapus tabel yang tidak didukung atau alihkan ke mode Direct Lake. | Karena Terbitkan ke Power BI membuat model semantik dengan mode Impor atau DirectQuery, model tidak dapat digunakan untuk menerbitkan ke himpunan data yang sudah ada yang menggunakan mode Direct Lake. Ikuti tautan ini untuk mempelajari lebih lanjut. |
Pengguna '<euii> *</euii> ' tidak memiliki izin untuk memanggil metode Temukan. |
Pastikan Anda menerbitkan ke ruang kerja Power BI dengan mode lisensi Premium. Anda tidak dapat menerbitkan ke ruang kerja dengan mode lisensi Pro. |
Pengguna '<euii> </euii> ' tidak memiliki izin untuk membuat objek baru di '**', atau objek tidak ada. |
Anda mungkin memiliki peran Penampil di ruang kerja Power BI. Periksa apakah Anda memiliki izin untuk membuat model semantik. Ikuti tautan ini untuk informasi selengkapnya. |
"Gagal memperbarui kredensial sumber data: [Microsoft][ThriftExtension] (14) Respons tak terduga dari server selama koneksi HTTP: Respons kesalahan Tidak Sah/Terlarang dikembalikan, tetapi tidak ada pesan kedaluwarsa token yang diterima." saat mengedit kredensial sumber data di Power BI | Periksa apakah ruang kerja Databricks Anda dapat diakses secara publik. Jika ruang kerja Anda menggunakan Private Link atau daftar akses IP, maka Anda mungkin perlu mengonfigurasi gateway lokal Power BI. |
Menyambungkan Power BI Desktop ke Azure Databricks
Anda dapat menyambungkan Power BI Desktop ke kluster Azure Databricks dan gudang Databricks SQL Anda. Anda juga dapat menerbitkan laporan Power BI ke layanan Power BI dan memungkinkan pengguna mengakses data Azure Databricks yang mendasar menggunakan akses menyeluruh (SSO), melewati kredensial ID Microsoft Entra yang sama dengan yang mereka gunakan untuk mengakses laporan.
Persyaratan
Power BI Desktop 2.85.681.0 atau di atasnya. Untuk menggunakan data yang dikelola oleh Katalog Unity dengan Power BI, Anda harus menggunakan Power BI Desktop 2.98.683.0 atau yang lebih tinggi (rilis Oktober 2021).
Catatan
Power BI Desktop membutuhkan Windows. Alternatif untuk sistem operasi lain adalah menjalankan Power BI Desktop pada host fisik atau mesin virtual berbasis Windows dan kemudian terhubung ke sana dari sistem operasi Anda.
Jika Anda menggunakan versi Power BI Desktop di bawah 2.85.681.0, Anda juga perlu menginstal driver Databricks ODBC di lingkungan yang sama dengan Power BI Desktop.
Token akses pribadi Azure Databricks atau kredensial akun ID Microsoft Entra Anda.
Catatan
Sebagai praktik terbaik keamanan saat Anda mengautentikasi dengan token akses pribadi, Databricks menyarankan agar Anda menggunakan token akses pribadi milik perwakilan layanan alih-alih pengguna ruang kerja. Untuk membuat token untuk perwakilan layanan, lihat Mengelola token untuk perwakilan layanan.
Menyambungkan Power BI Desktop ke Azure Databricks menggunakan Partner Connect
Anda dapat menggunakan Partner Connect untuk menyambungkan ke kluster atau gudang SQL dari Power BI Desktop hanya dengan beberapa klik.
Pastikan akun Azure Databricks Anda, ruang kerja, dan pengguna yang masuk semuanya memenuhi persyaratan untuk Partner Connect.
Di bar samping, klik ikon Marketplace
Marketplace.
Diintegrasi
Partner Connect, klik Lihat semua .Klik petak Power BI.
Dalam dialog Sambungkan ke mitra, untuk Komputasi, pilih nama sumber daya komputasi Azure Databricks yang ingin Anda sambungkan.
Pilih Unduh file sambungan.
Buka file sambungan yang diunduh, yang memulai Power BI Desktop.
Di Power BI Desktop, masukkan kredensial autentikasi Anda:
- Token Akses Pribadi: Masukkan token akses pribadi Azure Databricks Anda.
- MICROSOFT Entra ID: Klik Masuk lalu ikuti instruksi di layar.
Klik Sambungkan.
Pilih data Azure Databricks untuk mengkueri dari Navigator Power BI.
Menyambungkan Power BI Desktop ke Azure Databricks secara manual
Ikuti instruksi ini, tergantung pada metode autentikasi yang Anda pilih, untuk menyambungkan ke kluster atau gudang SQL dengan Power BI Desktop. Gudang SQL Databricks direkomendasikan saat menggunakan Power BI dalam mode DirectQuery .
Catatan
Untuk tersambung dengan lebih cepat ke Power BI Desktop, gunakan Partner Connect.
Dapatkan Nama Host Server dan Jalur HTTP.
Memulai Power BI Desktop.
Klik Dapatkan data atau File >Dapatkan data.
Klik Dapatkan data untuk memulai.
Cari Databricks, lalu klik konektor:
- Azure Databricks
Klik Sambungkan.
Dapatkan Nama Host Server dan Jalur HTTP.
Pilih mode Konektivitas Data Anda. Untuk informasi tentang perbedaan antara Impor dan DirectQuery, lihat Menggunakan DirectQuery di Power BI Desktop.
Klik OK.
Klik metode autentikasi Anda:
- Token Akses Pribadi: Masukkan token akses pribadi Azure Databricks Anda.
- MICROSOFT Entra ID: Klik Masuk lalu ikuti instruksi di layar.
Klik Sambungkan.
Pilih data Azure Databricks untuk mengkueri dari Navigator Power BI. Jika Katalog Unity diaktifkan untuk ruang kerja Anda, pilih katalog sebelum Anda memilih skema dan tabel.
Menggunakan kueri SQL khusus
Konektor Databricks menyediakan Databricks.Query
sumber data yang memungkinkan pengguna memberikan kueri SQL khusus.
Ikuti langkah-langkah yang dijelaskan dalam Sambungkan dengan Power BI Desktop untuk membuat koneksi, menggunakan Impor sebagai mode konektivitas data.
Di Navigator, klik kanan item paling atas yang berisi nama host dan jalur HTTP yang dipilih, lalu klik Ubah Data untuk membuka Editor Power Query.
Di bilah fungsi, ganti nama fungsi
Databricks.Catalogs
denganDatabricks.Query
dan terapkan perubahannya. Ini membuat fungsi Power Query yang menggunakan kueri SQL sebagai parameter.Masukkan kueri SQL di bidang parameter dan klik Panggil. Ini mengeksekusi kueri dan tabel baru dibuat dengan hasil kueri sebagai isinya.
Akses Azure Databricks menggunakan layanan Power BI
Saat menerbitkan laporan ke layanan Power BI, Anda tersambung ke Azure Databricks menggunakan token akses pribadi. Dalam layanan Power BI, Anda juga dapat mengaktifkan akses menyeluruh (SSO) sehingga pengguna dapat mengakses laporan yang dibuat menggunakan mode penyimpanan DirectQuery dengan meneruskan kredensial ID Microsoft Entra mereka ke Azure Databricks.
Publikasikan laporan Power BI Anda dari Power BI Desktop ke layanan Power BI.
Aktifkan akses menyeluruh (SSO) ke laporan dan sumber data yang mendasarinya.
- Buka himpunan data Azure Databricks yang mendasari untuk laporan di layanan Power BI, perluas Kredensial sumber data, dan klik Edit kredensial.
- Pada dialog konfigurasi, pilih Pemirsa laporan hanya dapat mengakses sumber data ini dengan identitas Power BI mereka sendiri menggunakan Kueri Langsung dan klik Masuk.
Dengan opsi ini dipilih, akses ke sumber data ditangani menggunakan DirectQuery dan dikelola menggunakan identitas ID Microsoft Entra pengguna yang mengakses laporan. Jika Anda tidak memilih opsi ini, hanya Anda, sebagai pengguna yang menerbitkan laporan, yang akan memiliki akses ke sumber data Azure Databricks.
Deteksi proksi HTTP otomatis
Power BI Desktop versi 2.104.941.0 dan yang lebih baru (rilis Mei 2022) memiliki dukungan bawaan untuk mendeteksi konfigurasi proksi HTTP seluruh sistem Windows.
Power BI Desktop dapat secara otomatis mendeteksi dan menggunakan konfigurasi proksi HTTP seluruh sistem Windows Anda.
Jika server proksi tidak menyediakan titik distribusi CRL (CDP), Power BI mungkin memperlihatkan pesan kesalahan berikut:
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
Untuk memperbaiki kesalahan ini, selesaikan langkah-langkah berikut:
Buat file
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
jika tidak ada.Tambahkan konfigurasi berikut ke file
microsoft.sparkodbc.ini
Anda:[Driver] CheckCertRevocation=0
Konektor Berbagi Delta Power BI
Konektor Berbagi Delta Power BI memungkinkan pengguna menemukan, menganalisis, dan memvisualisasikan himpunan data yang dibagikan dengan mereka melalui protokol terbuka Berbagi Delta. Protokol ini memungkinkan pertukaran dataset yang aman di seluruh produk dan platform dengan memanfaatkan REST dan penyimpanan cloud.
Untuk instruksi koneksi, lihat Power BI: Membaca data bersama.
Batasan
- Konektor Azure Databricks mendukung proksi web. Namun, pengaturan proksi otomatis yang ditentukan dalam file .pac tidak didukung.
- Di konektor Azure Databricks, sumber data
Databricks.Query
tidak didukung dalam kombinasi dengan mode DirectQuery. - Data yang dimuat konektor Berbagi Delta harus sesuai dengan memori komputer Anda. Untuk memastikan hal ini, konektor membatasi jumlah baris yang diimpor ke Batas Baris yang ditetapkan sebelumnya.