Bagikan melalui


Membuat ruangan bersih

Artikel ini menjelaskan cara membuat ruang yang bersih, lingkungan yang aman dan melindungi privasi di mana beberapa pihak dapat bekerja sama pada data perusahaan sensitif tanpa akses langsung ke data satu sama lain.

Sebelum Anda mulai

Hak istimewa yang diperlukan untuk menggunakan kamar bersih bervariasi tergantung pada tugas:

  • Untuk membuat ruangan yang bersih, Anda harus memiliki hak istimewa CREATE CLEAN ROOM atau menjadi admin metastore. Pembuat secara otomatis ditetapkan sebagai pemilik ruang bersih di metastore Katalog Unity mereka.

  • Untuk memulai partisipasi di ruang bersih yang dibagikan dengan Anda, Anda harus menjadi admin metastore.

    Ketika ruang bersih dibagikan, admin metastore organisasi kolaborator secara otomatis diberi kepemilikan ruang bersih. Admin metastore dapat menetapkan ulang kepemilikan ke admin non-metastore. Sebagai praktik terbaik untuk tata kelola data, Databricks merekomendasikan agar kepemilikan ditetapkan ke grup.

    Jika ruang kerja Anda tidak memiliki admin metastore yang ditetapkan, Anda harus menetapkan peran tersebut. Lihat Menetapkan seorang admin metastore dan Mengelola kepemilikan objek Unity Catalog.

  • Untuk menambahkan dan menghapus aset data dan buku catatan di ruangan yang bersih, Anda harus menjadi pemilik ruang bersih atau memiliki hak istimewa MODIFY CLEAN ROOM di ruangan yang bersih. Selain itu, Anda dan pemilik ruang bersih (jika Anda bukan pemilik) harus memiliki SELECT pada tabel dan tampilan yang Anda tambahkan dan READ VOLUME pada volume yang Anda tambahkan.

Untuk mempelajari tentang persyaratan izin untuk memperbarui ruang bersih dan menjalankan tugas (buku catatan) di ruang bersih, lihat Mengelola ruang bersih dan Menjalankan buku catatan di ruang bersih.

Anda dapat membuat hingga lima kamar bersih per metastore.

Langkah 1. Meminta identitas berbagi kolaborator

Sebelum Anda dapat membuat Ruang Bersih, Anda harus memiliki pengidentifikasi berbagi Ruang Bersih dari organisasi dengan siapa Anda akan berkolaborasi. Pengidentifikasi berbagi adalah string yang terdiri dari ID metastore global organisasi + ID ruang kerja + nama pengguna kontak (alamat email). Kolaborator dapat berada di cloud atau wilayah mana pun.

Hubungi kolaborator untuk meminta identitas berbagi mereka.

Kolaborator bisa mendapatkan ID berbagi dengan mengacu pada instruksi di Menemukan ID berbagi Anda.

Langkah 2. Membuat ruangan yang bersih

Untuk membuat ruang bersih, Anda harus menggunakan Catalog Explorer.

  1. Di ruang kerja Azure Databricks Anda, klik ikon Katalog Katalog.

  2. Pada halaman

    Atau, klik ikon Gear gerigi di bagian atas panel Katalog dan pilih Ruang Bersih.

  3. Klik Buat Ruang Bersih.

  4. Pada halaman Buat Ruang Bersih, masukkan nama yang mudah digunakan untuk ruang bersih.

    Nama tidak dapat menggunakan spasi, titik, atau garis miring (/).

    Anda tidak dapat mengubah nama kamar bersih setelah disimpan. Gunakan nama yang akan berguna dan deskriptif oleh kolaborator.

  5. Pilih penyedia cloud dan wilayah tempat ruang bersih pusat akan dibuat.

    Penyedia cloud harus sama dengan ruang kerja Anda saat ini, tetapi wilayah tersebut tidak. Pertimbangkan residensi data organisasi Anda atau kebijakan lain saat Anda membuat pilihan.

  6. (Opsional) Tambahkan komentar.

  7. Masukkan pengidentifikasi untuk berbagi "Clean Room" kolaborator dan.

    Lihat Langkah 1. Permintaan pengenal berbagi dari kolaborator.

    Anda dapat menguji ruang bersih milik Anda sebelum penyebaran penuh dengan menggunakan pengidentifikasi berbagi milik Anda atau pengidentifikasi pengguna lain di metastore Anda saat ini. Melakukannya menciptakan dua ruangan steril di metastore Anda saat ini. Misalnya, jika Anda membuat ruangan bersih berjudul test_clean_room, ruang bersih kedua bernama test_clean_room_collaborator juga muncul. Menjalankan notebook dengan kolaborator di metastore yang sama berfungsi sama seperti dengan kolaborator eksternal. Lihat Jalankan buku catatan di ruang bersih.

  8. Catat nama katalog yang ditetapkan untuk Anda (pembuat) dan kolaborator.

    Semua aset data yang ditambahkan ke ruang bersih akan muncul di bawah katalog tersebut di ruang bersih pusat, dan dapat dirujuk menggunakan katalog tersebut di dalam namespace tiga tingkat Katalog Unity (<catalog>.<schema>.<table-etc>).

  9. Pilih jenis kebijakan akses jaringan. Ini tidak dapat diubah setelah ruang bersih dibuat.

    Catatan

    Akses terbatas dapat menunda ketersediaan aset hingga sepuluh menit dan tidak mendukung kolaborator Google Cloud.

    Setelah membuat ruang bersih, Anda dapat melihat kebijakan akses jaringan di tab Keamanan.

  10. Klik Buat Ruang Bersih.

Jika ruang kerja Anda saat ini diatur ke profil keamanan kepatuhan HIPAA, maka ketika Anda membuat ruang yang bersih, pengaturan tersebut diterapkan ke ruang bersih pusat. Kolaborator perlu mengakses ruang bersih dari ruang kerja dengan profil keamanan yang sama. Lihat Profil Keamanan Kepatuhan .

Langkah 3. Menambahkan aset data dan notebook ke ruang bersih

Kedua pihak di ruang bersih (pembuat dan kolaborator) dapat menambahkan tabel, volume, tampilan, dan notebook ke ruang bersih.

Izin diperlukan:

  • Anda harus menjadi pemilik atau memiliki MODIFY CLEAN ROOM hak istimewa di kamar yang bersih.

  • Anda dan pemilik ruang bersih (jika Anda bukan pemilik) harus memiliki SELECT pada tabel atau tampilan apa pun dan READ VOLUME pada volume apa pun yang Anda tambahkan, bersamaan dengan USE CATALOG dan USE SCHEMA pada katalog dan skema induk.

    Pemilik kamar yang bersih harus menjaga hak istimewa ini sepanjang hidup ruangan yang bersih.

Catatan

Instruksi berikut mengasumsikan Anda kembali ke ruang bersih yang sudah dibuat untuk menambahkan aset. Jika Anda baru saja membuat ruang bersih untuk pertama kalinya, wizard akan memandu Anda dalam menambahkan aset data dan buku catatan. UI aktual untuk menambahkan aset ini sama, terlepas dari apakah Anda dipandu oleh wizard atau tidak.

Untuk menambahkan aset:

  1. Di ruang kerja Azure Databricks Anda, klik ikon Katalog Katalog.

  2. Pada halaman

    Atau, klik ikon Gear gerigi di bagian atas panel Katalog dan pilih Ruang Bersih.

  3. Temukan dan klik nama ruang bersih yang ingin Anda perbarui.

  4. Klik + Tambahkan aset data untuk menambahkan tabel, volume, atau tampilan.

  5. Pilih aset data yang ingin Anda bagikan dan klik Tambahkan aset data.

    Saat berbagi tabel, volume, atau tampilan, Anda dapat menambahkan alias secara opsional. Nama alias akan menjadi satu-satunya nama yang terlihat di ruang bersih.

    Saat berbagi tabel, Anda dapat menambahkan klausa partisi secara opsional yang memungkinkan Anda berbagi hanya sebagian dari tabel. Untuk detail tentang cara menggunakan partisi untuk membatasi apa yang Anda bagikan, lihat Menentukan partisi tabel untuk berbagi.

Catatan

Untuk berpartisipasi dalam Pratinjau Privat untuk berbagi tabel gabungan, hubungi perwakilan akun Azure Databricks Anda. Lihat Apa itu Lakehouse Federation?.

  1. Untuk menambahkan buku catatan, klik tombol + Tambahkan buku catatan dan telusuri buku catatan yang ingin Anda tambahkan.

    Anda dapat secara opsional memberi buku catatan nama Notebook alternatif.

    Notebook yang Anda bagikan di ruang bersih melakukan kueri data dan menjalankan beban kerja analisis data pada tabel, tampilan, dan volume yang telah Anda dan kolaborator lain tambahkan ke ruang bersih.

    Notebook beroperasi berdasarkan prinsip persetujuan implisit: Anda tidak dapat menjalankan buku catatan yang Anda buat. Anda membuat buku catatan yang digunakan kolaborator Anda, dan kolaborator Anda membuat buku catatan yang Anda gunakan.

    Jika Anda berbagi buku catatan yang menyertakan hasil, hasil tersebut akan dibagikan dengan kolaborator Anda.

    Anda bisa menggunakan notebook untuk membuat tabel output yang dibagikan sementara ke metastore kolaborator Anda ketika notebook dijalankan. Lihat Membuat dan bekerja dengan tabel output di Databricks Clean Rooms.

    Untuk menggunakan dataset pengujian, unduh contoh notebook kami.

    Penting

    Setiap referensi notebook ke tabel, tampilan, atau volume yang ditambahkan ke ruang bersih harus menggunakan nama katalog yang ditetapkan saat ruang bersih dibuat ("pembuat" untuk aset data yang ditambahkan oleh pembuat ruang bersih, dan "kolaborator" untuk aset data yang ditambahkan oleh kolaborator yang diundang). Misalnya, tabel yang ditambahkan oleh pembuat dapat diberi nama creator.sales.california.

    Demikian juga, verifikasi bahwa notebook menggunakan alias apa pun yang telah ditetapkan sebagai aset data di ruang bersih.