Extrahujte dátumy a čísla z dokumentov
Zatiaľ čo mnohé polia, ktoré sa majú extrahovať, sú jednoduché texty, existujú prípady, keď je informácia na extrahovanie dátum alebo číslo vrátane čiastok.
Import týchto údajov do cieľového systému môže byť ťažkopádny a vyžaduje značnú vlastnú konverznú logiku. Väčšina importovaných konektorov a rozhraní API akceptuje iba normalizované dátumy vo formáte ISO 8601, ako je napr YYYY-MM-DD
. Akceptujú tiež iba čísla s bodkou (.
) ako oddeľovač desatinných miest bez oddeľovača tisícok NNN.DD
.
Ak sa chcete dozvedieť viac o formáte dátumu, prejdite na Formát dátumu a času ISO 8601.
Pridali sme možnosť deklarovať tento typ počas vytvárania poľa krok sprievodcu a zvoliť si dátum alebo číselnú konvenciu (ekvivalent miestneho nastavenia).
Dátumové konvencie
Nasledujúci príklad zobrazuje výpis z hypotéky s dátumovým poľom.
Nasledujúci príklad zobrazuje formáty polí dátumu.
Podporované formáty dátumu
Pri definovaní poľa vyberte spomedzi Rok, Mesiac, Deň; Mesiac, Deň, Rok; alebo Deň, mesiac, rok.
Nasledujúce znaky možno použiť ako oddeľovače dátumu: ,
-
/
.
\
. Medzery nemožno použiť ako oddeľovač. Napríklad:
- 01,01,2020
- 01-01-2020
- 1. 1. 2020
Deň a mesiac môžu byť zapísané ako jedna alebo dve číslice a rok môže byť dve alebo štyri číslice:
- 1-1-2020
- 1-01-20
Ak má dátumový reťazec osem číslic, oddeľovač je voliteľný:
- 01012020
- 01 01 2020
Mesiac môže byť napísaný aj ako jeho celý alebo krátky názov. Ak sa použije názov, oddeľovacie znaky sú voliteľné. Tento formát však môže byť rozpoznaný menej presne ako ostatné.
- 1. januára 2020
- 1. januára 2020
- 1. januára 2020
Číselné konvencie
Nasledujúci príklad zobrazuje výpis z hypotéky s číselnými poľami.
Nasledujúci príklad zobrazuje formáty číselných polí.
Poznámka
Pre každé pole je povolená len jedna konvencia pre dané pole pre všetky kolekcie tohto modelu. Ak napríklad vyberiete množstvo poľa výberom možnosti Použiť čiarku (,) ako oddeľovač desatinných miest, nasledujúci text 1234,56 alebo 1 234,56 sa skonvertuje na 1234,56. Sumy vo formáte 12,34,576.78 alebo 1 234,56 sa neprevedú.
Počas extrakcie sa text automaticky skonvertuje podľa poskytnutej konvencie. Túto prevedenú hodnotu je možné získať pomocou YOURFIELDNAME value
výsledku. Ak konverzia nie je možná, táto hodnota je prázdna. Pôvodný text je možné získať pomocou YOURFIELDNAME text
výsledku.
Podporované formáty čísel
Pri definovaní poľa vyberte buď Použiť bodku (.) ako oddeľovač desatinných miest alebo Použiť ako oddeľovač desatinných miest čiarku (,).
Ak je oddeľovač desatinných miest bodka (.
), možno vynechať oddeľovače tisícov a použiť čiarku (,
) alebo medzeru. Napríklad:
- 1234.56
- 1,234.56
- 1 234.56
Keď je oddeľovač desatinných miest čiarka (,
), tisíce oddeľovačov alebo medzery možno vynechať. Napríklad:
- 1234,56
- 1 234.56
Ďalší krok
Trénujte a publikujte svoj spracovanie dokumentov model
Súvisiace informácie
Školenie: Spracovanie vlastných dokumentov pomocou AI Builder (modul)