استخراج التواريخ والأرقام من المستندات
وعلى الرغم من أن العديد من الحقول التي سيتم استخراجها هي حقول بسيطة، فهناك حالات تكون فيها المعلومات التي يتم استخراجها عبارة عن تاريخ أو رقم يتضمن مبالغ.
قد يكون استيراد هذه البيانات إلى نظام مستهدف مرهقًا، ويتطلب منطق تحويل مخصصًا كبيرًا. تقبل معظم موصلات الاستيراد وواجهات برمجة التطبيقات فقط التواريخ الموحدة بتنسيق ISO 8601 مثل YYYY-MM-DD
. كما أنها تقبل فقط الأرقام التي تستخدم النقطة (.
) كفاصل عشري بدون فاصل آلاف مثل NNN.DD
.
لمعرفة المزيد حول تنسيق التاريخ، انتقل إلى تنسيق التاريخ والوقت ISO 8601.
لقد أضفنا القدرة على الإعلان عن هذا النوع أثناء خطوة إنشاء الحقل للمعالج واختيار تاريخ أو رقمي (يعادل الإعدادات المحية).
اصطلاحات التاريخ
يوضح المثال التالي بيان الرهن العقاري مع حقل التاريخ.
يوضح المثال التالي تنسيقات حقل التاريخ.
تنسيقات التاريخ المدعومة
عند تعريف الحقل، اختر من بين السنة، الشهر، اليوم أو الشهر، اليوم، السنة أو اليوم، الشهر، السنة.
يمكن استخدام الأحرف التالية كمحددات تاريخ: ,
-
/
.
\
. لا يمكن استخدام المسافة البيضاء كمحدد. على سبيل المثال:
- 01,01,2020
- 01-01-2020
- 01/01/2020
يمكن كتابة اليوم والشهر كل على أنه رقم واحد أو رقمين، وبإمكان السنة أن تكون عبارة عن رقمين أو أربعة أرقام:
- 1-1-2020
- 1-01-20
إذا تضمن سلسلة التاريخ ثمانية أرقام، يكون المحدد اختياريًا:
- 01012020
- 01 01 2020
يمكن أيضًأ كتابة الشهر باسمه الكامل أو اسمه القصير. إذا تم استخدام الاسم، فإن الأحرف المحددة تكون اختياريه. ومع ذلك، قد يتم التعرف على هذا التنسيق بدقة أقل من التنسيقات الأخرى.
- 01/يناير/2020
- 01يناير2020
- 01 يناير 2020
اصطلاحات الأرقام
يوضح المثال التالي بيان الرهن العقاري مع حقول الأرقام.
يوضح المثال التالي تنسيقات حقل الرقم.
ملاحظة
لكل حقل، يُسمح باصطلاح واحد فقط لحقل معين لجميع مجموعات هذا النموذج. على سبيل المثال، إذا قمت باستخراج مبلغ حقل بتحديد استخدام الفاصلة (,) كفاصل عشري (,)، يتم تحويل النص التالي 1234,56 أو 1 234,56 إلى 1234.56. لا يتم تحويل المبالغ ذات التنسيق 12,34,576.78 1,234.56.
وأثناء الاستخراج، يتم تحويل النص تلقائيًا حسب الاصطلاح المقدمة. ويمكن استرداد هذه القيمة التي تم تحويلها باستخدام نتيجة YOURFIELDNAME value
. تكون هذه القيمة فارغة إذا لم يكن التحويل ممكنًا. يمكن استرداد النص الأصلي باستخدام نتيجة YOURFIELDNAME text
.
تنسيقات الأرقام المدعومة
عند تعريف الحقل، اختر إما استخدام النقطة (.) كفاصل عشري أو استخدام الفاصلة (،) كفاصل عشري.
عندما يكون الفاصل العشري نقطة (.
)، يمكن حذف فواصل الآلاف، ويمكن استخدام فاصلة (,
) أو مساحة بيضاء. على سبيل المثال:
- 1234.56
- 1,234.56
- 1 234.56
عندما يكون الفاصل العشري فاصلة (,
)، يمكن حذف فواصل الآلاف أو المساحة البيضاء. على سبيل المثال:
- 1234,56
- 1 234.56
الخطوة التالية
تدريب نموذج معالجة المستندات ونشره
(راجع أيضًا)
التدريب: معالجة المستندات المخصصة باستخدام AI Builder (الوحدة النمطية)