Ekstrakt datume i brojeve iz dokumenata

Iako su mnoga polja koja treba izdvojiti jednostavni tekstovi, postoje slučajevi u kojima je informacija za izdvajanje datum ili broj, uključujući iznose.

Uvoz ovih podataka u ciljni sistem može biti glomazan, zahtevajući značajnu prilagođenu logiku konverzije. Većina konektora za uvoz i API-ja prihvata samo normalizovane datume u ISO 8601 formatu kao što su YYYY-MM-DD. Oni takođe prihvataju samo brojeve koji koriste tačku (.) kao decimalni separator bez hiljadu separatora kao NNN.DD.

Da biste saznali više o formatu datuma, idite na ISO 8601 Format datuma i vremena.

Dodali smo mogućnost da deklarišete ovaj tip tokom korak kreiranja polja čarobnjaka, i da izaberete konvenciju datuma ili broja (ekvivalentno jeziku).

Datumske konvencije

Sledeći primer prikazuje izjavu o hipoteki sa datumom polja.

Snimak ekrana 'Date polja' u 'Pregled'.

Sledeći primer prikazuje formate polja datuma.

Snimak ekrana formata 'Polje datuma'.

Podržani formati datuma

Prilikom definisanja polja, izaberite između godine, meseca, dana; Mesec, dan, godina; ili dan, mesec, godina.

Sledeći znakovi se mogu koristiti kao razdjelnici datuma: ,-/.\ Razmak se ne može koristiti kao razdjelnik. Na primer:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

Dan i mesec mogu se napisati kao jedna ili dve cifre, a godina može biti dve ili četiri cifre:

  • 1-1-2020
  • 1-01-20

Ako string datuma ima osam cifara, razdjelnik je opcion:

  • 01012020
  • 01 01 2020

Mesec se takođe može napisati kao njegovo puno ili kratko ime. Ako se koristi ime, razdjelnički znakovi su opcioni. Međutim, ovaj format može biti prepoznat manje precizno od drugih.

  • 01 jan / 2020
  • Vlajkovićeva 2020
  • U.br.12/2020

Brojčane konvencije

Sledeći primer prikazuje hipoteka izjavu sa brojem polja.

Snimak ekrana

Sledeći primer prikazuje formate polja brojeva.

Snimak ekrana formata 'Polje za brojeve'.

Belešku

Za svako polje, dozvoljena je samo jedna konvencija za određeno polje za sve kolekcije ovog modela. Na primer, ako izvučete količinu polja tako što ćete izabrati Koristi zarez (,) kao decimalni separator, sledeći tekst 1234,56 ili 1 234,56 se pretvara u 1234.56. Iznosi sa formatom 12,34,576.78 ili 1,234.56 se ne konvertuju.

Tokom ekstrakcije, tekst se automatski pretvara u skladu sa predviđenom konvencijom. Ova konvertovana vrednost može se preuzeti pomoću rezultata YOURFIELDNAME value . Ova vrednost je prazna ako konverzija nije moguća. Originalni tekst se može preuzeti pomoću rezultata YOURFIELDNAME text .

Podržani formati brojeva

Kada definišete polje, izaberite ili Koristi tačku (.) kao decimalni separator ili Koristi zarez (,) kao decimalni separator.

Kada je decimalni separator tačka (.), hiljadu separatora može biti izostavljeno, i može se koristiti zarez (,) ili razmak. Na primer:

  • 1234.56
  • 1,234.56
  • 1 234.56

Kada je decimalni separator zarez (,), hiljadu separatora ili razmaka se može izostaviti. Na primer:

  • 1234,56
  • 1 234.56

Sledeći korak

Obučite i objavite svoj model obrada dokumenata

Obuka: Obradite prilagođene dokumente sa AI Builder (modulom)