Bagikan melalui


Akses data yang dibagikan kepada Anda dengan menggunakan Delta Sharing (untuk penerima)

Artikel ini memperlihatkan cara mengakses data yang telah dibagikan dengan Anda menggunakan Berbagi Delta.

Berbagi Delta dan penerima data

Delta Sharing adalah standar terbuka untuk berbagi data yang aman. Pengguna Databricks, yang disebut sebagai penyedia data dalam konteks ini, dapat menggunakan Berbagi Delta di Azure Databricks untuk berbagi data dengan seseorang atau grup di luar organisasi mereka, yang disebut penerima data.

Berbagi databricks-ke-Databricks dan berbagi terbuka

Bagaimana Anda mengakses data tergantung pada apakah Anda sendiri adalah pengguna Databricks dan apakah penyedia data Anda mengonfigurasi data yang dibagikan dengan Anda untuk berbagi Databricks-ke-Databricks atau berbagi terbuka atau tidak.

Dalam model Databricks-to-Databricks, Anda harus menjadi pengguna di ruang kerja Databricks yang memiliki kemampuan untuk mendukung Unity Catalog. Anggota tim Anda menyediakan penyedia data dengan pengidentifikasi unik untuk metastore Katalog Unity Anda, dan penyedia data menggunakannya untuk membuat koneksi berbagi yang aman. Data bersama tersedia untuk akses di ruang kerja Anda. Jika perlu, anggota tim Anda mengonfigurasi kontrol akses terperinci pada data tersebut.

Dalam model berbagi terbuka, Anda dapat menggunakan alat apa pun yang Anda suka (termasuk Databricks) untuk mengakses data bersama. Penyedia data mengirimkan URL aktivasi melalui saluran aman. Anda mengikutinya untuk mengunduh file kredensial yang memungkinkan Anda mengakses data yang dibagikan dengan Anda.

Data bersama tidak disediakan oleh Databricks secara langsung tetapi oleh penyedia data yang berjalan di Azure Databricks.

Catatan

Databricks dapat mengumpulkan informasi tentang penggunaan dan akses penerima data ke data bersama (termasuk mengidentifikasi individu atau perusahaan yang mengakses data menggunakan file kredensial sehubungan dengan informasi tersebut) dan dapat membagikannya dengan penyedia data yang berlaku.

Mendapatkan akses ke data yang dibagikan dengan Anda

Cara Anda mengakses data bergantung pada apakah penyedia data Anda berbagi data dengan Anda menggunakan protokol berbagi terbuka atau protokol berbagi Databricks-to-Databricks. Lihat Berbagi databricks-ke-Databricks dan berbagi terbuka.

Dapatkan akses pada model Databricks-to-Databricks

Dalam model Databricks-to-Databricks:

  1. Penyedia data mengirimkan instruksi untuk menemukan pengidentifikasi unik untuk Unity Catalog metastore yang terkait dengan ruang kerja Databricks Anda, dan Anda mengirimkannya kepada mereka.

    Pengidentifikasi untuk berbagi adalah string yang terdiri dari cloud metastore, wilayah, dan UUID (pengidentifikasi unik untuk metastore) dalam format <cloud>:<region>:<uuid>. Contohnya,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Untuk mendapatkan pengidentifikasi pembagian menggunakan Catalog Explorer:

    1. Di ruang kerja Azure Databricks Anda, klik ikon Katalog Katalog.

    2. Di bagian atas panel Katalog , klik ikon Gerigi dan pilih Berbagi Delta.

      Atau, dari halaman Akses cepat, klik tombol Berbagi > Delta.

    3. Pada tab Dibagikan dengan saya, klik nama organisasi Databricks Anda di kanan atas, dan pilih Salin pengidentifikasi pembagian.

    Untuk mendapatkan identifikasi berbagi dengan menggunakan notebook atau kueri Databricks SQL, gunakan fungsi SQL default CURRENT_METASTORE. Jika Anda menggunakan laptop, perangkat tersebut harus berjalan pada mode akses standar atau mode akses khusus di ruang kerja yang akan Anda gunakan untuk mengakses data bersama.

    SELECT CURRENT_METASTORE();
    
  2. Penyedia data membuat:

    • Penerima di akun Databricks mereka untuk mewakili Anda dan pengguna di organisasi Anda yang akan mengakses data.
    • berbagi, yang merupakan representasi tabel, volume, dan tampilan yang akan dibagikan dengan Anda.
  3. Anda mengakses data yang dibagikan dengan Anda. Anda atau seseorang di tim Anda dapat, jika perlu, mengonfigurasi akses data terperinci pada data tersebut untuk pengguna Anda. Lihat Membaca data yang dibagikan menggunakan Databricks-to-Databricks Delta Sharing (untuk penerima).

Mendapatkan akses dalam model berbagi terbuka

Dalam model berbagi terbuka:

  1. Penyedia data membuat:

    • Penerima di akun Databricks mereka untuk mewakili Anda dan pengguna di organisasi Anda yang akan mengakses data. File token dan kredensial dihasilkan sebagai bagian dari konfigurasi ini.
    • Bagian , yang merupakan representasi dari tabel dan partisi yang akan dibagikan dengan Anda.
  2. Penyedia data mengirimkan URL aktivasi melalui saluran aman. Anda mengikutinya untuk mengunduh file kredensial yang memungkinkan Anda mengakses data yang dibagikan dengan Anda.

    Token pembawa dan Kredensial Klien OAuth didukung.

    Penting

    Jangan bagikan tautan aktivasi dengan siapa pun. Anda dapat mengunduh file kredensial hanya sekali. Jika Anda mengunjungi tautan aktivasi lagi setelah file kredensial diunduh, tombol Unduh File Kredensial dinonaktifkan.

    Jika Anda kehilangan tautan aktivasi sebelum menggunakannya, hubungi penyedia data.

  3. Simpan file info masuk di lokasi yang aman.

    Jangan bagikan file kredensial dengan siapa pun di luar grup pengguna yang seharusnya memiliki akses ke data bersama. Jika Anda perlu membagikannya dengan seseorang di organisasi Anda, Databricks merekomendasikan untuk menggunakan pengelola kata sandi.

Membaca data yang dibagikan

Cara membaca data yang telah dibagikan dengan aman menggunakan Delta Sharing tergantung pada apakah Anda menerima file kredensial (model berbagi terbuka) atau Anda berada dalam ruang kerja Databricks dan memberikan pengidentifikasi berbagi Anda kepada penyedia data (model Databricks-ke-Databricks).

Membaca data bersama menggunakan file kredensial (berbagi terbuka)

Jika data telah dibagikan dengan Anda menggunakan protokol berbagi terbuka Delta Sharing, Anda menggunakan file kredensial yang Anda unduh untuk mengautentikasi pada akun penyedia data dan membaca data bersama. Akses bertahan selama token yang mendasar valid dan penyedia terus berbagi data. Penyedia mengelola kedaluwarsa dan rotasi token. Pembaruan data tersedia untuk Anda dalam waktu dekat. Anda dapat membaca dan membuat salinan data bersama, tetapi Anda tidak dapat mengubah data sumber.

Untuk mempelajari cara mengakses dan membaca data bersama menggunakan file kredensial di Azure Databricks, Apache Spark, pandas, dan Power BI, lihat Membaca data yang dibagikan menggunakan fitur Delta Sharing yang terbuka (untuk penerima).

Membaca data bersama menggunakan berbagi Databricks-ke-Databricks

Jika data telah dibagikan dengan Anda menggunakan model Databricks-to-Databricks, maka tidak ada file kredensial yang diperlukan untuk mengakses data bersama. Databricks mengurus koneksi yang aman, dan data bersama secara otomatis dapat ditemukan di ruang kerja Databricks Anda.

Untuk mempelajari cara menemukan, membaca, dan mengelola data yang dibagikan di ruang kerja Databricks Anda, rujuk pada Membaca data yang dibagikan melalui Berbagi Delta dari Databricks ke Databricks (untuk penerima).

Mengaudit penggunaan data bersama

Jika Anda memiliki akses ke ruang kerja Azure Databricks, Anda dapat menggunakan log audit Azure Databricks untuk memahami siapa di organisasi Anda yang mengakses data mana yang menggunakan Berbagi Delta. Lihat Mengaudit dan memantau berbagi data.

Langkah berikutnya