Bagikan melalui


Apa itu skema lakehouse (Pratinjau)?

Lakehouse mendukung pembuatan skema kustom. Skema memungkinkan Anda mengelompokkan tabel untuk penemuan data, kontrol akses, dan lainnya yang lebih baik.

Membuat skema lakehouse

Untuk mengaktifkan dukungan skema untuk lakehouse Anda, centang kotak di samping skema Lakehouse (Pratinjau Umum) saat Anda membuatnya.

Cuplikan layar memperlihatkan dialog lakehouse baru.

Penting

Nama ruang kerja hanya boleh berisi karakter alfanumerik karena keterbatasan pratinjau. Jika karakter khusus digunakan dalam nama ruang kerja, beberapa fitur Lakehouse tidak akan berfungsi.

Setelah membuat lakehouse, Anda dapat menemukan skema default bernama dbo di bawah Tabel. Skema ini selalu ada dan tidak dapat diubah atau dihapus. Untuk membuat skema baru, arahkan mouse ke atas Tabel, pilih ..., dan pilih Skema baru. Masukkan nama skema Anda dan pilih Buat. Anda akan melihat skema Anda tercantum di bawah Tabel dalam urutan alfabet.

Cuplikan layar memperlihatkan dialog skema lakehouse baru.

Menyimpan tabel dalam skema lakehouse

Anda memerlukan nama skema untuk menyimpan tabel dalam skema. Jika tidak, itu masuk ke skema dbo default.

df.write.mode("Overwrite").saveAsTable("contoso.sales")

Anda dapat menggunakan Lakehouse Explorer untuk mengatur tabel Anda dan menyeret dan meletakkan nama tabel ke skema yang berbeda.

Animasi memindahkan tabel antar skema.

Perhatian

Jika Anda mengubah tabel, Anda juga harus memperbarui item terkait seperti kode buku catatan atau aliran data untuk memastikannya selaras dengan skema yang benar.

Membawa beberapa tabel dengan pintasan skema

Untuk mereferensikan beberapa tabel Delta dari fabric lakehouse atau penyimpanan eksternal lainnya, gunakan pintasan skema yang menampilkan semua tabel di bawah skema atau folder yang dipilih. Setiap perubahan pada tabel di lokasi sumber juga muncul dalam skema. Untuk membuat pintasan skema, arahkan mouse ke atas Tabel, pilih pada ..., dan pilih Pintasan skema baru. Kemudian pilih skema di lakehouse lain, atau folder dengan tabel Delta di penyimpanan eksternal Anda seperti Azure Data Lake Storage (ADLS) Gen2. Itu membuat skema baru dengan tabel yang dirujuk.

Cuplikan layar memperlihatkan pintasan skema lakehouse baru.

Mengakses skema lakehouse untuk pelaporan Power BI

Untuk membuat model semantik Anda, cukup pilih tabel yang ingin Anda gunakan. Tabel dapat berada dalam skema yang berbeda. Jika tabel dari skema yang berbeda memiliki nama yang sama, Anda akan melihat angka di samping nama tabel saat dalam tampilan model.

Skema Lakehouse di notebook

Saat Anda melihat lakehouse yang diaktifkan skema di penjelajah objek buku catatan, Anda melihat tabel berada dalam skema. Anda dapat menyeret dan meletakkan tabel ke dalam sel kode dan mendapatkan cuplikan kode yang mengacu pada skema tempat tabel berada. Gunakan namespace layanan ini untuk merujuk ke tabel dalam kode Anda: "workspace.lakehouse.schema.table". Jika Anda meninggalkan salah satu elemen, pelaksana menggunakan pengaturan default. Misalnya, jika Anda hanya memberikan nama tabel, nama tabel menggunakan skema default (dbo) dari lakehouse default untuk buku catatan.

Penting

Jika Anda ingin menggunakan skema dalam kode Anda, pastikan bahwa lakehouse default untuk buku catatan diaktifkan skema.

Kueri Spark SQL lintas ruang kerja

Gunakan namespace "workspace.lakehouse.schema.table" untuk merujuk ke tabel dalam kode Anda. Dengan cara ini, Anda dapat menggabungkan tabel dari ruang kerja yang berbeda jika pengguna yang menjalankan kode memiliki izin untuk mengakses tabel.

SELECT * 
    FROM operations.hr.hrm.employees as employees 
    INNER JOIN global.corporate.company.departments as departments
    ON employees.deptno = departments.deptno;

Penting

Pastikan Anda menggabungkan tabel hanya dari lakehouse yang mengaktifkan skema. Menggabungkan tabel dari lakehouse yang tidak mengaktifkan skema tidak akan berfungsi.

Batasan pratinjau publik

Fitur/fungsionalitas yang tidak didukung yang tercantum di bawah ini adalah untuk rilis pratinjau publik saat ini. Mereka akan diselesaikan dalam rilis yang akan datang sebelum Ketersediaan Umum.

Fitur/Fungsionalitas yang Tidak Didukung Catatan
Rumah danau bersama Menggunakan ruang kerja di namespace layanan untuk lakehouse bersama tidak akan berfungsi, misalnya wokrkspace.sharedlakehouse.schema.table. Pengguna THe harus memiliki peran ruang kerja untuk menggunakan ruang kerja di namaspace.
Non-Delta, Skema tabel terkelola Mendapatkan skema untuk tabel terkelola yang diformat non-Delta (misalnya, CSV) tidak didukung. Memperluas tabel ini di lakehouse explorer tidak menampilkan informasi skema apa pun di UX.
Tabel Spark Eksternal Operasi tabel Spark eksternal (misalnya, penemuan, mendapatkan skema, dll.) tidak didukung. Tabel ini tidak dikenal di UX.
API Publik API Publik (Tabel daftar, Tabel beban, mengekspos properti yang diperluas defaultSchema, dll.) tidak didukung untuk Lakehouse yang diaktifkan skema. API publik yang ada yang dipanggil pada skema yang diaktifkan Lakehouse menghasilkan kesalahan.
Memperbarui properti tabel Tidak didukung.
Nama ruang kerja yang berisi karakter khusus Ruang kerja dengan karakter khusus (misalnya, spasi, garis miring) tidak didukung. Kesalahan pengguna ditampilkan.
Tampilan Spark Tidak didukung.
Fitur khusus Apache Hive Tidak didukung.
Spark.catalog API Tidak didukung. Gunakan Spark SQL sebagai gantinya.
USE <schemaName> Tidak berfungsi lintas ruang kerja, tetapi didukung dalam ruang kerja yang sama.
Migration Migrasi Lakehouse non-skema yang ada ke Lakehouses berbasis skema tidak didukung.