Bagikan melalui


Interoperabilitas format tabel Delta Lake

Dalam Microsoft Fabric, format tabel Delta Lake adalah standar untuk analitik. Delta Lake adalah lapisan penyimpanan sumber terbuka yang menyediakan transaksi ACID (Atomicity, Consistency, Isolation, Durability) untuk beban kerja big data dan analitik.

Semua pengalaman Fabric menghasilkan dan mengonsumsi tabel Delta Lake, mendorong interoperabilitas, dan pengalaman produk terpadu. Tabel Delta Lake yang diproduksi oleh satu mesin komputasi, seperti Fabric Data Warehouse atau Synapse Spark, dapat dikonsumsi oleh mesin lain, seperti Power BI. Saat Anda menyerap data ke Fabric, Fabric menyimpannya sebagai tabel Delta secara default. Anda dapat dengan mudah mengintegrasikan data eksternal yang berisi tabel Delta Lake dengan menggunakan pintasan OneLake.

Fitur Delta Lake dan pengalaman Fabric

Untuk mencapai interoperabilitas, semua pengalaman di Fabric disesuaikan dengan fitur Delta Lake dan kemampuan Fabric. Beberapa pengalaman hanya dapat menulis ke tabel Delta Lake, sementara yang lain dapat membaca darinya.

  • Writers: Gudang data, eventstream, dan model semantik Power BI yang diekspor ke OneLake
  • Pembaca: Titik Akhir Analitik SQL dan Model Semantik Direct Lake Power BI
  • Penulis dan pembaca: Runtime Fabric Spark, aliran data, alur data, dan database Kusto Query Language (KQL)

Matriks berikut menunjukkan fitur Utama Delta Lake dan dukungannya pada setiap kemampuan Fabric.

Kemampuan fabric Pemetaan kolom berbasis nama Vektor penghapusan Penulisan urutan V Pengoptimalan dan pemeliharaan tabel Menulis partisi Membaca partisi Pengklusteran Cairan TIMESTAMP_NTZ Versi pembaca/penulis Delta dan fitur tabel default
Ekspor Gudang Data Delta Lake Tidak Ya Ya Ya Tidak Ya Tidak Tidak Pembaca: 3
Penulis: 7
Vektor Penghapusan
Titik akhir analitik SQL Ya Ya N/A (tidak berlaku) N/A (tidak berlaku) N/A (tidak berlaku) Ya Ya Tidak N/A (tidak berlaku)
Fabric Spark Runtime 1.3 Ya Ya Ya Ya Ya Ya Ya Ya Pembaca: 1
Penulis: 2
Fabric Spark Runtime 1.2 Ya Ya Ya Ya Ya Ya Ya, baca saja Ya Pembaca: 1
Penulis: 2
Fabric Spark Runtime 1.1 Ya Tidak Ya Ya Ya Ya Ya, baca saja Tidak Pembaca: 1
Penulis: 2
Aliran Data Ya Ya Ya Tidak Ya Ya Ya, baca saja Tidak Pembaca: 1
Penulis: 2
Pipa Data Tidak Tidak Ya Tidak Ya, timpa saja Ya Ya, baca saja Tidak Pembaca: 1
Penulis: 2
Model semantik danau langsung Power BI Ya Ya N/A (tidak berlaku) N/A (tidak berlaku) N/A (tidak berlaku) Ya Ya Tidak N/A (tidak berlaku)
Mengekspor model semantik Power BI ke OneLake Ya N/A (tidak berlaku) Ya Tidak Ya N/A (tidak berlaku) Tidak Tidak Pembaca: 2
Penulis: 5
Database KQL Ya Ya Tidak Tidak ada* Ya Ya Tidak Tidak Pembaca: 1
Penulis: 1
Eventstreams Tidak Tidak Tidak Tidak Ya N/A (tidak berlaku) Tidak Tidak Pembaca: 1
Penulis: 2

* Basis data KQL menyediakan kemampuan tertentu untuk pemeliharaan tabel, seperti retensi . Data dihapus di akhir periode retensi dari OneLake. Untuk informasi selengkapnya, lihat Satu salinan logis.

Nota

  • Fabric tidak menulis pemetaan kolom berbasis nama secara default. Pengalaman Fabric default menghasilkan tabel yang kompatibel di seluruh layanan. Delta lake, yang diproduksi oleh layanan pihak ketiga, mungkin memiliki fitur tabel yang tidak kompatibel.
  • Beberapa pengalaman Fabric tidak memiliki kemampuan pengoptimalan tabel dan pemeliharaan yang diwariskan, seperti pemadatan bin, urutan V, dan pembersihan file lama yang tidak direferensikan. Agar tabel Delta Lake tetap optimal untuk analitik, ikuti teknik dalam Gunakan fitur pemeliharaan tabel untuk mengelola tabel delta di Fabric untuk tabel yang diserap menggunakan pengalaman tersebut.

Batasan saat ini

Saat ini, Fabric tidak mendukung fitur Delta Lake ini:

  • Seragam Delta Lake 3.x
  • Penulisan kolom identitas pada fitur eksklusif Databricks
  • Tabel Langsung Delta (fitur Databricks eksklusif)
  • RLE (Pengodean Panjang Eksekusi) diaktifkan pada file titik pemeriksaan