Apa itu skema lakehouse (Pratinjau)?
Lakehouse mendukung pembuatan skema kustom. Skema memungkinkan Anda mengelompokkan tabel untuk penemuan data, kontrol akses, dan lainnya yang lebih baik.
Membuat skema lakehouse
Untuk mengaktifkan dukungan skema untuk lakehouse Anda, centang kotak di samping skema Lakehouse (Pratinjau Umum) saat Anda membuatnya.
Penting
Nama ruang kerja hanya boleh berisi karakter alfanumerik karena keterbatasan pratinjau. Jika karakter khusus digunakan dalam nama ruang kerja, beberapa fitur Lakehouse tidak akan berfungsi.
Setelah membuat lakehouse, Anda dapat menemukan skema default bernama dbo di bawah Tabel. Skema ini selalu ada dan tidak dapat diubah atau dihapus. Untuk membuat skema baru, arahkan mouse ke atas Tabel, pilih ..., dan pilih Skema baru. Masukkan nama skema Anda dan pilih Buat. Anda akan melihat skema Anda tercantum di bawah Tabel dalam urutan alfabet.
Menyimpan tabel dalam skema lakehouse
Anda memerlukan nama skema untuk menyimpan tabel dalam skema. Jika tidak, itu masuk ke skema dbo default.
df.write.mode("Overwrite").saveAsTable("contoso.sales")
Anda dapat menggunakan Lakehouse Explorer untuk mengatur tabel Anda dan menyeret dan meletakkan nama tabel ke skema yang berbeda.
Perhatian
Jika Anda mengubah tabel, Anda juga harus memperbarui item terkait seperti kode buku catatan atau aliran data untuk memastikannya selaras dengan skema yang benar.
Membawa beberapa tabel dengan pintasan skema
Untuk mereferensikan beberapa tabel Delta dari fabric lakehouse atau penyimpanan eksternal lainnya, gunakan pintasan skema yang menampilkan semua tabel di bawah skema atau folder yang dipilih. Setiap perubahan pada tabel di lokasi sumber juga muncul dalam skema. Untuk membuat pintasan skema, arahkan mouse ke atas Tabel, pilih pada ..., dan pilih Pintasan skema baru. Kemudian pilih skema di lakehouse lain, atau folder dengan tabel Delta di penyimpanan eksternal Anda seperti Azure Data Lake Storage (ADLS) Gen2. Itu membuat skema baru dengan tabel yang dirujuk.
Mengakses skema lakehouse untuk pelaporan Power BI
Untuk membuat model semantik Anda, cukup pilih tabel yang ingin Anda gunakan. Tabel dapat berada dalam skema yang berbeda. Jika tabel dari skema yang berbeda memiliki nama yang sama, Anda akan melihat angka di samping nama tabel saat dalam tampilan model.
Skema Lakehouse di notebook
Saat Anda melihat lakehouse yang diaktifkan skema di penjelajah objek buku catatan, Anda melihat tabel berada dalam skema. Anda dapat menyeret dan meletakkan tabel ke dalam sel kode dan mendapatkan cuplikan kode yang mengacu pada skema tempat tabel berada. Gunakan namespace layanan ini untuk merujuk ke tabel dalam kode Anda: "workspace.lakehouse.schema.table". Jika Anda meninggalkan salah satu elemen, pelaksana menggunakan pengaturan default. Misalnya, jika Anda hanya memberikan nama tabel, nama tabel menggunakan skema default (dbo) dari lakehouse default untuk buku catatan.
Penting
Jika Anda ingin menggunakan skema dalam kode Anda, pastikan bahwa lakehouse default untuk buku catatan diaktifkan skema.
Kueri Spark SQL lintas ruang kerja
Gunakan namespace "workspace.lakehouse.schema.table" untuk merujuk ke tabel dalam kode Anda. Dengan cara ini, Anda dapat menggabungkan tabel dari ruang kerja yang berbeda jika pengguna yang menjalankan kode memiliki izin untuk mengakses tabel.
SELECT *
FROM operations.hr.hrm.employees as employees
INNER JOIN global.corporate.company.departments as departments
ON employees.deptno = departments.deptno;
Penting
Pastikan Anda menggabungkan tabel hanya dari lakehouse yang mengaktifkan skema. Menggabungkan tabel dari lakehouse yang tidak mengaktifkan skema tidak akan berfungsi.
Batasan pratinjau publik
Fitur/fungsionalitas yang tidak didukung yang tercantum di bawah ini adalah untuk rilis pratinjau publik saat ini. Mereka akan diselesaikan dalam rilis yang akan datang sebelum Ketersediaan Umum.
Fitur/Fungsionalitas yang Tidak Didukung | Catatan |
---|---|
Rumah danau bersama | Menggunakan ruang kerja di namespace layanan untuk lakehouse bersama tidak akan berfungsi, misalnya wokrkspace.sharedlakehouse.schema.table. Pengguna THe harus memiliki peran ruang kerja untuk menggunakan ruang kerja di namaspace. |
Non-Delta, Skema tabel terkelola | Mendapatkan skema untuk tabel terkelola yang diformat non-Delta (misalnya, CSV) tidak didukung. Memperluas tabel ini di lakehouse explorer tidak menampilkan informasi skema apa pun di UX. |
Tabel Spark Eksternal | Operasi tabel Spark eksternal (misalnya, penemuan, mendapatkan skema, dll.) tidak didukung. Tabel ini tidak dikenal di UX. |
API Publik | API Publik (Tabel daftar, Tabel beban, mengekspos properti yang diperluas defaultSchema, dll.) tidak didukung untuk Lakehouse yang diaktifkan skema. API publik yang ada yang dipanggil pada skema yang diaktifkan Lakehouse menghasilkan kesalahan. |
Memperbarui properti tabel | Tidak didukung. |
Nama ruang kerja yang berisi karakter khusus | Ruang kerja dengan karakter khusus (misalnya, spasi, garis miring) tidak didukung. Kesalahan pengguna ditampilkan. |
Tampilan Spark | Tidak didukung. |
Fitur khusus Apache Hive | Tidak didukung. |
Spark.catalog API | Tidak didukung. Gunakan Spark SQL sebagai gantinya. |
USE <schemaName> |
Tidak berfungsi lintas ruang kerja, tetapi didukung dalam ruang kerja yang sama. |
Migration | Migrasi Lakehouse non-skema yang ada ke Lakehouses berbasis skema tidak didukung. |