Bagikan melalui


Dukungan varian di Delta Lake

Penting

Fitur ini ada di Pratinjau Publik.

Anda dapat menggunakan VARIANT jenis data untuk menyimpan data semi terstruktur di Delta Lake. Untuk contoh tentang bekerja dengan VARIANT, lihat Data varian kueri.

Anda harus menggunakan Databricks Runtime 15.3 atau lebih tinggi untuk membaca dan menulis tabel dengan dukungan varian diaktifkan.

Mengaktifkan varian pada tabel Delta

Untuk mengaktifkan varian, buat tabel baru dengan VARIANT kolom jenis, misalnya:

CREATE TABLE table_name (variant_column VARIANT)

Anda juga dapat mengaktifkan dukungan untuk VARIANT pada tabel yang sudah ada menggunakan sintaks berikut:

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

Peringatan

Saat Anda mengaktifkan varian, protokol tabel ditingkatkan. Setelah memutakhirkan, tabel tidak akan dapat dibaca oleh klien Delta Lake yang tidak mendukung varian. Lihat Bagaimana Azure Databricks mengelola kompatibilitas fitur Delta Lake?.

Batasan

Keterbatasan berikut ada:

  • Anda tidak dapat menggunakan kolom varian untuk mempartisi tabel.
  • Kolom varian tidak dapat menjadi kunci pengklusteran untuk tabel.
  • Anda tidak dapat menggunakan kolom varian dengan klausa GROUP BY atau ORDER BY.
  • Anda tidak dapat memanggil DISTINCT pada kolom varian.
  • Anda tidak dapat menggunakan operator set SQL (INTERSECT, UNION, EXCEPT) dengan kolom varian.
  • Anda tidak dapat menggunakan pembuatan kolom untuk membuat kolom varian.
  • Delta tidak mengumpulkan minValues atau maxValues statistik untuk kolom varian.