Dukungan varian di Delta Lake
Penting
Fitur ini ada di Pratinjau Publik.
Anda dapat menggunakan VARIANT
jenis data untuk menyimpan data semi terstruktur di Delta Lake. Untuk contoh tentang bekerja dengan VARIANT
, lihat Data varian kueri.
Anda harus menggunakan Databricks Runtime 15.3 atau lebih tinggi untuk membaca dan menulis tabel dengan dukungan varian diaktifkan.
Mengaktifkan varian pada tabel Delta
Untuk mengaktifkan varian, buat tabel baru dengan VARIANT
kolom jenis, misalnya:
CREATE TABLE table_name (variant_column VARIANT)
Anda juga dapat mengaktifkan dukungan untuk VARIANT
pada tabel yang sudah ada menggunakan sintaks berikut:
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Peringatan
Saat Anda mengaktifkan varian, protokol tabel ditingkatkan. Setelah memutakhirkan, tabel tidak akan dapat dibaca oleh klien Delta Lake yang tidak mendukung varian. Lihat Bagaimana Azure Databricks mengelola kompatibilitas fitur Delta Lake?.
Batasan
Keterbatasan berikut ada:
- Anda tidak dapat menggunakan kolom varian untuk mempartisi tabel.
- Kolom varian tidak dapat menjadi kunci pengklusteran untuk tabel.
- Anda tidak dapat menggunakan kolom varian dengan klausa
GROUP BY
atauORDER BY
. - Anda tidak dapat memanggil
DISTINCT
pada kolom varian. - Anda tidak dapat menggunakan operator set SQL (
INTERSECT
,UNION
,EXCEPT
) dengan kolom varian. - Anda tidak dapat menggunakan pembuatan kolom untuk membuat kolom varian.
- Delta tidak mengumpulkan
minValues
ataumaxValues
statistik untuk kolom varian.