Tata kelola data dengan Unity Catalog
Panduan ini memperlihatkan cara mengelola data dan akses objek AI di Azure Databricks. Untuk informasi tentang keamanan Azure Databricks, lihat Panduan keamanan. Azure Databricks menyediakan tata kelola terpusat untuk data dan AI dengan Unity Catalog dan Delta Sharing.
Mempusatkan kontrol akses menggunakan Katalog Unity
Unity Catalog adalah solusi tata kelola yang terperinci untuk data dan AI pada platform Databricks. Ini membantu menyederhanakan keamanan dan tata kelola data dan aset AI Anda dengan menyediakan tempat terpusat untuk mengelola dan mengaudit akses ke data dan aset AI.
Di sebagian besar akun, Unity Catalog diaktifkan secara default saat Anda membuat ruang kerja. Untuk detailnya, lihat Pengaktifan Unity Catalog secara otomatis.
Untuk mengetahui cara menggunakan Katalog Unity secara efektif, lihat praktik terbaik Katalog Unity.
Melacak silsilah data menggunakan Katalog Unity
Anda dapat menggunakan Unity Catalog untuk mengambil silsilah data runtime di seluruh kueri dalam bahasa apa pun yang dijalankan pada kluster Azure Databricks atau gudang SQL. Silsilah data diambil ke tingkat kolom, dan menyertakan buku catatan, pekerjaan, dan dasbor yang terkait dengan kueri. Untuk mempelajari selengkapnya, lihat Mengambil dan melihat silsilah data menggunakan Unity Catalog.
Menemukan data menggunakan Catalog Explorer
Databricks Catalog Explorer menyediakan UI untuk menjelajahi dan mengelola data dan aset AI, termasuk skema (database), tabel, volume (data non-tabular), dan model ML terdaftar, bersama dengan izin aset, pemilik data, lokasi eksternal, dan kredensial. Anda dapat menggunakan tab Insights di Catalog Explorer untuk melihat kueri terbaru dan pengguna tabel apa pun yang terdaftar di Unity Catalog.
Berbagi data menggunakan Delta Sharing
Berbagi Delta adalah protokol terbuka yang dikembangkan oleh Databricks untuk berbagi data dan aset AI yang aman dengan organisasi lain, atau dengan tim lain dalam organisasi Anda, terlepas dari platform komputasi mana yang mereka gunakan.
Mengonfigurasi log audit
Databricks menyediakan akses ke log audit aktivitas yang dilakukan oleh pengguna Databricks, memungkinkan perusahaan Anda untuk memantau pola penggunaan Databricks terperinci.
Unity Catalog memungkinkan Anda dengan mudah mengakses dan mengkueri data operasional akun Anda, termasuk log audit, penggunaan yang dapat dikenakan biaya, dan garis keturunan menggunakan tabel sistem (Pratinjau Umum).
Mengonfigurasi identitas
Setiap cerita tata kelola data yang baik dimulai dengan fondasi identitas yang kuat. Untuk mempelajari cara terbaik mengonfigurasi identitas di Azure Databricks, lihat Praktik terbaik identitas.
Solusi tata kelola data warisan
Azure Databricks juga menyediakan model tata kelola warisan ini:
- Kontrol akses tabel adalah model tata kelola data lama yang memungkinkan Anda memberikan dan mencabut akses secara terprogram ke objek yang dikelola oleh metastore Hive bawaan di ruang kerja Anda. Databricks merekomendasikan agar Anda menggunakan Unity Catalog alih-alih kontrol akses tabel. Unity Catalog menyederhanakan keamanan dan tata kelola data Anda dengan menyediakan tempat terpusat untuk mengelola dan mengaudit akses data di beberapa ruang kerja di akun Anda.
- Passthrough kredensial Azure Data Lake Storage (warisan) juga merupakan fitur tata kelola data warisan yang memungkinkan Anda mengautentikasi secara otomatis ke Azure Storage dari kluster Azure Databricks menggunakan identitas ID Microsoft Entra yang sama dengan yang Anda gunakan untuk masuk ke Azure Databricks. Databricks merekomendasikan agar Anda menggunakan Unity Catalog sebagai gantinya.