Penegakan skema
Azure Databricks memvalidasi kualitas data dengan memberlakukan skema saat menulis.
Nota
Artikel ini menjelaskan perilaku default untuk tabel di Azure Databricks, yang didukung oleh Delta Lake. Penegakan skema tidak berlaku untuk tabel yang didukung oleh data eksternal.
Penegakan skema untuk operasi penyisipan
Azure Databricks memberlakukan aturan berikut saat menyisipkan data ke dalam tabel:
- Semua kolom yang disisipkan harus ada dalam tabel target.
- Semua jenis data kolom harus cocok dengan jenis data kolom dalam tabel target.
Nota
Azure Databricks mencoba mengubah tipe data kolom dengan aman agar sesuai dengan tabel tujuan.
Validasi skema selama operasi MERGE
Azure Databricks memberlakukan aturan berikut saat menyisipkan atau memperbarui data sebagai bagian dari operasi MERGE
:
- Jika tipe data dalam pernyataan sumber tidak cocok dengan kolom target,
MERGE
mencoba melemparkan jenis data kolom dengan aman agar sesuai dengan tabel target. - Kolom yang menjadi target tindakan
UPDATE
atauINSERT
harus ada dalam tabel target. - Saat menggunakan sintaks
INSERT *
atauUPDATE SET *
:- Kolom dalam himpunan data sumber yang tidak ada dalam tabel target diabaikan.
- Himpunan data sumber harus memiliki semua kolom yang ada dalam tabel target.
Mengubah skema tabel
Anda dapat memperbarui skema tabel menggunakan pernyataan ALTER TABLE
eksplisit atau evolusi skema otomatis. Lihat Pembaruan skema tabel Delta Lake.
Evolusi skema memiliki makna khusus untuk operasi MERGE
. Lihat Evolusi skema otomatis untuk penggabungan Delta Lake.