FSCK REPAIR TABLE
A következőkre vonatkozik: Databricks SQL
Databricks Runtime
Eltávolítja a fájlbejegyzéseket egy olyan Delta-tábla tranzakciónaplójából, amely már nem található az alapul szolgáló fájlrendszerben. Ez akkor fordulhat elő, ha ezeket a fájlokat manuálisan törölték.
Szintaxis
FSCK REPAIR TABLE table_name [DRY RUN]
Paraméterek
-
Egy meglévő Delta-táblát azonosít. A név nem tartalmazhat időbeli specifikációt vagy beállításspecifikációt.
PRÓBAÜZEM
A Delta-tábla
FSCK REPAIR TABLE
tranzakciónaplójából eltávolított fájlbejegyzésekkel kapcsolatos információkat jeleníti meg, mivel azok már nem találhatók az alapul szolgáló fájlrendszerben. Ez akkor fordulhat elő, ha ezeket a fájlokat manuálisan törölték. A fájlbejegyzések adatfájl elérési útjai vagy egy adatfájl elérési útjának és a törlési vektorfájl elérési útjának kombinációja. A fájlbejegyzések akkor jelennek meg a kimenetben, ha az adatfájl hiányzik, a törlési vektorfájl hiányzik, vagy ha mindkettő hiányzik.Alapértelmezés szerint
DRY RUN
csak az első 1000 fájlt adja vissza. Ezt a küszöbértéket úgy növelheti, hogy a SparkSession változótspark.databricks.delta.fsck.maxNumEntriesInResult
magasabb értékre állítja, mielőtt futtatja a parancsot egy jegyzetfüzetben.
Visszatérítések
Az DRY RUN
űrlap jelentéséhez:
dataFilePath STRING NOT NULL
dataFileMissing BOOLEAN NOT NULL
deletionVectorPath STRING
deletionVectorFileMissing BOOLEAN NOT NULL
Példák
— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet true null false
— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet false dv1.bin true