Zdieľať cez


Extrahujte dátumy a čísla z dokumentov

Zatiaľ čo mnohé polia, ktoré sa majú extrahovať, sú jednoduché texty, existujú prípady, keď je informácia na extrahovanie dátum alebo číslo vrátane čiastok.

Import týchto údajov do cieľového systému môže byť ťažkopádny a vyžaduje značnú vlastnú konverznú logiku. Väčšina importovaných konektorov a rozhraní API akceptuje iba normalizované dátumy vo formáte ISO 8601, ako je napr YYYY-MM-DD. Akceptujú tiež iba čísla s bodkou (.) ako oddeľovač desatinných miest bez oddeľovača tisícok NNN.DD.

Ak sa chcete dozvedieť viac o formáte dátumu, prejdite na Formát dátumu a času ISO 8601.

Pridali sme možnosť deklarovať tento typ počas vytvárania poľa krok sprievodcu a zvoliť si dátum alebo číselnú konvenciu (ekvivalent miestneho nastavenia).

Dátumové konvencie

Nasledujúci príklad zobrazuje výpis z hypotéky s dátumovým poľom.

Snímka obrazovky „Pole Dátum“ v „Prehľade“.

Nasledujúci príklad zobrazuje formáty polí dátumu.

Snímka obrazovky formátov poľa dátumu.

Podporované formáty dátumu

Pri definovaní poľa vyberte spomedzi Rok, Mesiac, Deň; Mesiac, Deň, Rok; alebo Deň, mesiac, rok.

Nasledujúce znaky možno použiť ako oddeľovače dátumu: ,-/.\. Medzery nemožno použiť ako oddeľovač. Napríklad:

  • 01,01,2020
  • 01-01-2020
  • 1. 1. 2020

Deň a mesiac môžu byť zapísané ako jedna alebo dve číslice a rok môže byť dve alebo štyri číslice:

  • 1-1-2020
  • 1-01-20

Ak má dátumový reťazec osem číslic, oddeľovač je voliteľný:

  • 01012020
  • 01 01 2020

Mesiac môže byť napísaný aj ako jeho celý alebo krátky názov. Ak sa použije názov, oddeľovacie znaky sú voliteľné. Tento formát však môže byť rozpoznaný menej presne ako ostatné.

  • 1. januára 2020
  • 1. januára 2020
  • 1. januára 2020

Číselné konvencie

Nasledujúci príklad zobrazuje výpis z hypotéky s číselnými poľami.

Snímka obrazovky „Pole Číslo“ v „Prehľade“.

Nasledujúci príklad zobrazuje formáty číselných polí.

Snímka obrazovky formátov „Číselné pole“.

Poznámka

Pre každé pole je povolená len jedna konvencia pre dané pole pre všetky kolekcie tohto modelu. Ak napríklad vyberiete množstvo poľa výberom možnosti Použiť čiarku (,) ako oddeľovač desatinných miest, nasledujúci text 1234,56 alebo 1 234,56 sa skonvertuje na 1234,56. Sumy vo formáte 12,34,576.78 alebo 1 234,56 sa neprevedú.

Počas extrakcie sa text automaticky skonvertuje podľa poskytnutej konvencie. Túto prevedenú hodnotu je možné získať pomocou YOURFIELDNAME value výsledku. Ak konverzia nie je možná, táto hodnota je prázdna. Pôvodný text je možné získať pomocou YOURFIELDNAME text výsledku.

Podporované formáty čísel

Pri definovaní poľa vyberte buď Použiť bodku (.) ako oddeľovač desatinných miest alebo Použiť ako oddeľovač desatinných miest čiarku (,).

Ak je oddeľovač desatinných miest bodka (.), možno vynechať oddeľovače tisícov a použiť čiarku (,) alebo medzeru. Napríklad:

  • 1234.56
  • 1,234.56
  • 1 234.56

Keď je oddeľovač desatinných miest čiarka (,), tisíce oddeľovačov alebo medzery možno vynechať. Napríklad:

  • 1234,56
  • 1 234.56

Ďalší krok

Trénujte a publikujte svoj spracovanie dokumentov model

Školenie: Spracovanie vlastných dokumentov pomocou AI Builder (modul)