جدول إصلاح FSCK
ينطبق على: Databricks SQL
Databricks Runtime
إزالة إدخالات الملف من سجل المعاملات لجدول Delta الذي لم يعد من الممكن العثور عليه في نظام الملفات الأساسي. يمكن أن يحدث هذا عندما يتم حذف هذه الملفات يدويا.
بناء الجملة
FSCK REPAIR TABLE table_name [DRY RUN]
المعلمات
-
تعريف جدول Delta موجود. يجب ألا يتضمن الاسم مواصفات زمنية أو مواصفات خيارات.
تشغيل جاف
يعرض معلومات حول إدخالات الملف التي ستتم إزالتها من سجل المعاملات لجدول Delta بواسطة
FSCK REPAIR TABLE
، لأنه لم يعد من الممكن العثور عليها في نظام الملفات الأساسي. يمكن أن يحدث هذا عندما يتم حذف هذه الملفات يدويا. إدخالات الملف هي إما مسار ملف بيانات أو مزيج من مسار ملف بيانات ومسار ملف متجه الحذف. يتم تضمين إدخالات الملف في الإخراج عندما يكون ملف البيانات مفقودا، أو عندما يكون ملف متجه الحذف مفقودا، أو عندما يكون كلاهما مفقودا.بشكل افتراضي،
DRY RUN
يتم إرجاع أول 1000 ملف فقط. يمكنك زيادة هذا الحد عن طريق تعيين متغيرspark.databricks.delta.fsck.maxNumEntriesInResult
SparkSession إلى قيمة أعلى قبل تشغيل الأمر في دفتر ملاحظات.
المرتجعات
للحصول على DRY RUN
تقرير النموذج:
dataFilePath STRING NOT NULL
dataFileMissing BOOLEAN NOT NULL
deletionVectorPath STRING
deletionVectorFileMissing BOOLEAN NOT NULL
الأمثلة
— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet true null false
— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
------------- --------------- ------------------ -------------------------
file1.parquet false dv1.bin true