Apa itu skema di Azure Databricks?
Di Unity Catalog, skema adalah anak dari katalog
Artikel ini menjelaskan peran skema dalam hierarki objek data Azure Databricks di Unity Catalog.
Untuk informasi tentang skema di metastore Apache Hive lokal ruang kerja warisan, lihat Objek database di metastore Apache Hive warisan.
Apa itu skema?
Dalam Katalog Unity, skema adalah level kedua dari namespace tiga tingkat Unity Catalog (catalog.schema.table-etc
).
skema
Skema mengatur data dan aset AI ke dalam kategori logis yang lebih terperinci daripada katalog. Biasanya skema mewakili satu kasus penggunaan, proyek, atau sandbox tim. Terlepas dari jenis kategori, skema adalah alat yang berguna untuk mengelola kontrol akses data dan meningkatkan penemuan data.
Catatan
Di Azure Databricks, skema terkadang disebut database. Misalnya, CREATE DATABASE
adalah alias untuk CREATE SCHEMA
. Terminologi ini berbeda dari beberapa sistem database relasional di mana database adalah kumpulan skema.
Untuk informasi selengkapnya tentang hierarki objek data di Unity Catalog, lihat Apa itu objek database di Azure Databricks?.
Lokasi terkelola untuk skema
Di Unity Catalog Anda dapat secara fisik mengisolasi data untuk semua tabel terkelola dan volume terkelola dalam skema dari skema lain dalam katalog dengan menentukan lokasi penyimpanan terkelola untuk skema. Ini sepenuhnya opsional. Jika Anda tidak menentukan lokasi penyimpanan terkelola untuk skema, data berada di lokasi penyimpanan terkelola katalog (dan jika tidak ada yang ditentukan untuk katalog, data berada di lokasi penyimpanan terkelola metastore). Lihat Menentukan lokasi penyimpanan terkelola di Unity Catalog.
Isolasi data untuk tabel dan volume eksternal bergantung pada cara Anda mengelola data di penyimpanan cloud Anda. Skema ini bersifat independen dari lokasi terkelola.