FSCK REPAIR TABLE
Şunlar için geçerlidir: Databricks SQL
Databricks Runtime
Delta tablosunun işlem günlüğünden dosya girdilerini kaldırır ve bu girdiler artık temel alınan dosya sisteminde bulunamaz. Bu dosyalar el ile silindiğinde bu durum oluşabilir.
Sözdizimi
FSCK REPAIR TABLE table_name [DRY RUN]
Parametreler
-
Var olan bir Delta tablosunu tanımlar. Ad bir zamansal belirtim veya seçenek belirtimi içermemelidir.
KURU ÇALıŞTıRMA
Bir Delta tablosunun
FSCK REPAIR TABLE
işlem günlüğünden tarafından kaldırılacak dosya girişleri hakkındaki bilgileri gösterir çünkü bunlar artık temel alınan dosya sisteminde bulunamaz. Bu dosyalar el ile silindiğinde bu durum oluşabilir. Dosya girdileri bir veri dosyası yolu veya veri dosyası yolu ile silme vektör dosyası yolunun birleşimidir. Veri dosyası eksik olduğunda, silme vektör dosyası eksik olduğunda veya her ikisi de eksik olduğunda dosya girdileri çıktıya eklenir.Varsayılan olarak,
DRY RUN
yalnızca ilk 1000 dosyayı döndürür. Komutu not defterinde çalıştırmadan önce SparkSession değişkeninispark.databricks.delta.fsck.maxNumEntriesInResult
daha yüksek bir değere ayarlayarak bu eşiği artırabilirsiniz.
Döndürülenler
Formun A raporu için DRY RUN
:
dataFilePath STRING NOT NULL
dataFileMissing BOOLEAN NOT NULL
deletionVectorPath STRING
deletionVectorFileMissing BOOLEAN NOT NULL
Örnekler
— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet true null false
— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet false dv1.bin true