Ketersediaan Eventhouse OneLake
Anda dapat membuat salinan logis data database KQL di eventhouse dengan mengaktifkan ketersediaan OneLake. Mengaktifkan ketersediaan OneLake berarti Anda dapat mengkueri data dalam database KQL Anda dalam format Delta Lake melalui mesin Fabric lainnya seperti mode Direct Lake di Power BI, Gudang, Lakehouse, Notebook, dan banyak lagi.
Delta Lake adalah format tabel data lake terpadu yang mencapai akses data tanpa hambatan di semua mesin komputasi di Microsoft Fabric. Untuk informasi selengkapnya tentang Delta Lake, lihat Apa itu Delta Lake?.
Dalam artikel ini, Anda mempelajari cara mengaktifkan ketersediaan data database KQL di OneLake.
Cara kerjanya
Anda dapat mengaktifkan ketersediaan OneLake pada tingkat database atau tabel. Saat diaktifkan di tingkat database, semua tabel baru dan datanya tersedia di OneLake. Saat mengaktifkan fitur, Anda juga dapat memilih untuk menerapkan opsi ini ke tabel yang sudah ada dengan memilih opsi Terapkan ke tabel yang sudah ada. Mengaktifkan fitur pada tingkat tabel hanya membuat tabel tersebut dan datanya dapat diakses di OneLake. Kebijakan penyimpanan data database KQL Anda juga diterapkan ke data di OneLake. Data yang dihapus dari database KQL Anda di akhir periode retensi juga dihapus dari OneLake. Jika Anda menonaktifkan ketersediaan OneLake, data akan dihapus secara sementara dari OneLake.
Saat ketersediaan OneLake diaktifkan, Anda tidak dapat melakukan tugas berikut:
- Mengganti nama tabel
- Mengubah skema tabel
- Menerapkan Keamanan Tingkat Baris ke tabel
- Data tidak dapat dihapus, dipotong, atau dihapus menyeluruh
Jika Anda perlu melakukan salah satu tugas ini, gunakan langkah-langkah berikut:
Penting
Menonaktifkan ketersediaan OneLake menghapus data Anda dari OneLake. Saat Anda mengaktifkan kembali ketersediaan, hanya data baru yang tersedia di OneLake tanpa isi ulang data yang dihapus.
Nonaktifkan ketersediaan OneLake.
Lakukan tugas yang diinginkan.
Aktifkan ketersediaan OneLake.
Penting
Untuk informasi selengkapnya tentang waktu yang diperlukan agar data muncul di OneLake, lihat perilaku adaptif .
Tidak ada biaya penyimpanan tambahan untuk mengaktifkan ketersediaan OneLake. Untuk informasi selengkapnya, lihat konsumsi sumber daya.
Prasyarat
- Ruang kerja dengan kapasitas yang diaktifkan Microsoft Fabric
- Database KQL dengan izin pengeditan dan data
Mengaktifkan ketersediaan OneLake
Anda dapat mengaktifkan ketersediaan OneLake baik pada database KQL atau tingkat tabel.
Untuk mengaktifkan ketersediaan OneLake, telusuri ke bagian OneLake di panel detail database atau tabel KQL Anda.
Atur Ketersediaan ke Aktif.
Database di-refresh secara otomatis.
Anda mengaktifkan ketersediaan OneLake di database KQL Anda. Sekarang Anda dapat mengakses semua data baru yang ditambahkan ke database Anda di jalur OneLake yang diberikan dalam format Delta Lake. Anda juga dapat memilih untuk membuat pintasan OneLake dari Lakehouse, Gudang Data, atau mengkueri data secara langsung melalui mode Power BI Direct Lake.
Perilaku adaptif
Eventhouse menawarkan mekanisme kuat yang secara cerdas mengumpulkan aliran data masuk ke dalam satu atau beberapa file Parquet, yang disusun untuk analisis. Batching aliran data penting saat berhadapan dengan data yang menetas. Menulis banyak file Parquet kecil ke dalam danau dapat tidak efisien sehingga menghasilkan biaya yang lebih tinggi dan performa yang buruk.
Mekanisme adaptif Eventhouse dapat menunda operasi penulisan jika tidak ada cukup data untuk membuat file Parquet yang optimal. Ini memastikan file Parquet berukuran optimal dan mematuhi praktik terbaik Delta Lake. Mekanisme adaptif Eventhouse memastikan bahwa file Parquet prima untuk analisis dan menyeimbangkan kebutuhan ketersediaan data yang cepat dengan pertimbangan biaya dan performa.
Catatan
- Secara default, operasi tulis dapat memakan waktu hingga 3 jam atau hingga file dengan ukuran yang cukup (biasanya 200-256 MB) dibuat.
- Anda dapat menyesuaikan penundaan ke nilai antara 5 menit dan 3 jam.
Misalnya, gunakan perintah berikut untuk mengatur penundaan menjadi 5 menit:
.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);
Perhatian
Menyesuaikan penundaan ke periode yang lebih singkat dapat mengakibatkan tabel delta suboptimal dengan sejumlah besar file kecil, yang dapat menyebabkan performa kueri yang tidak efisien. Tabel yang dihasilkan di OneLake bersifat baca-saja dan tidak dapat dioptimalkan setelah pembuatan.
Anda dapat memantau kapan data baru ditambahkan di danau dengan memeriksa latensi data Anda menggunakan perintah .show table mirroring operations.
Hasil diukur dari terakhir kali data ditambahkan. Ketika Latensi menghasilkan 00:00:00, semua data dalam database KQL tersedia di OneLake.
Tampilkan file
Saat Anda mengaktifkan ketersediaan OneLake pada tabel, folder log delta dibuat bersama dengan file JSON dan Parquet yang sesuai. Anda dapat melihat file yang tersedia di OneLake dan propertinya sambil tetap berada dalam Real-Time Intelligence.
Untuk menampilkan file, arahkan mouse ke atas tabel di panel Explorer lalu pilih menu Lainnya [...]>Lihat file.
Untuk melihat properti folder log delta atau file individual, arahkan mouse ke folder atau file lalu pilih menu Lainnya [...]>Properti.
Untuk melihat file di folder log delta:
- Pilih folder _delta_log.
- Pilih file untuk melihat metadata dan skema tabel. Editor yang terbuka dalam format baca-saja.
Mengakses kebijakan pencerminan
Secara default, saat ketersediaan OneLake diaktifkan, kebijakan pencerminan diaktifkan. Anda dapat menggunakan kebijakan untuk memantau latensi data atau mengubahnya menjadi tabel delta partisi.
Catatan
Jika Anda menonaktifkan ketersediaan OneLake, properti kebijakan IsEnabled
pencerminan diatur ke false (IsEnabled=false
).
Tabel delta partisi
Anda dapat mempartisi tabel delta Anda untuk meningkatkan kecepatan kueri. Untuk informasi tentang kapan harus mempartisi file OneLake Anda, lihat Kapan harus mempartisi tabel. Setiap partisi direpresentasikan sebagai kolom terpisah menggunakan PartitionName yang tercantum dalam daftar Partisi. Ini berarti salinan OneLake Anda memiliki lebih banyak kolom daripada tabel sumber Anda.
Untuk mempartisi tabel delta Anda, gunakan perintah pencerminan kebijakan tabel .alter-merge.
Konten terkait
- Untuk mengekspos data di OneLake, lihat Membuat pintasan di OneLake
- Untuk membuat pintasan OneLake di Lakehouse, lihat Apa itu pintasan di lakehouse?
- Untuk mengkueri data yang dirujuk dari OneLake di database atau tabel KQL Anda, lihat Membuat pintasan OneLake di database KQL