Ekstrakt datume i brojeve iz dokumenata
Iako su mnoga polja koja treba izdvojiti jednostavni tekstovi, postoje slučajevi u kojima je informacija za izdvajanje datum ili broj, uključujući iznose.
Uvoz ovih podataka u ciljni sistem može biti glomazan, zahtevajući značajnu prilagođenu logiku konverzije. Većina konektora za uvoz i API-ja prihvata samo normalizovane datume u ISO 8601 formatu kao što su YYYY-MM-DD
. Oni takođe prihvataju samo brojeve koji koriste tačku (.
) kao decimalni separator bez hiljadu separatora kao NNN.DD
.
Da biste saznali više o formatu datuma, idite na ISO 8601 Format datuma i vremena.
Dodali smo mogućnost da deklarišete ovaj tip tokom korak kreiranja polja čarobnjaka, i da izaberete konvenciju datuma ili broja (ekvivalentno jeziku).
Datumske konvencije
Sledeći primer prikazuje izjavu o hipoteki sa datumom polja.
Sledeći primer prikazuje formate polja datuma.
Podržani formati datuma
Prilikom definisanja polja, izaberite između godine, meseca, dana; Mesec, dan, godina; ili dan, mesec, godina.
Sledeći znakovi se mogu koristiti kao razdjelnici datuma: ,
-
/
.
\
Razmak se ne može koristiti kao razdjelnik. Na primer:
- 01,01,2020
- 01-01-2020
- 01/01/2020
Dan i mesec mogu se napisati kao jedna ili dve cifre, a godina može biti dve ili četiri cifre:
- 1-1-2020
- 1-01-20
Ako string datuma ima osam cifara, razdjelnik je opcion:
- 01012020
- 01 01 2020
Mesec se takođe može napisati kao njegovo puno ili kratko ime. Ako se koristi ime, razdjelnički znakovi su opcioni. Međutim, ovaj format može biti prepoznat manje precizno od drugih.
- 01 jan / 2020
- Vlajkovićeva 2020
- U.br.12/2020
Brojčane konvencije
Sledeći primer prikazuje hipoteka izjavu sa brojem polja.
Sledeći primer prikazuje formate polja brojeva.
Belešku
Za svako polje, dozvoljena je samo jedna konvencija za određeno polje za sve kolekcije ovog modela. Na primer, ako izvučete količinu polja tako što ćete izabrati Koristi zarez (,) kao decimalni separator, sledeći tekst 1234,56 ili 1 234,56 se pretvara u 1234.56. Iznosi sa formatom 12,34,576.78 ili 1,234.56 se ne konvertuju.
Tokom ekstrakcije, tekst se automatski pretvara u skladu sa predviđenom konvencijom. Ova konvertovana vrednost može se preuzeti pomoću rezultata YOURFIELDNAME value
. Ova vrednost je prazna ako konverzija nije moguća. Originalni tekst se može preuzeti pomoću rezultata YOURFIELDNAME text
.
Podržani formati brojeva
Kada definišete polje, izaberite ili Koristi tačku (.) kao decimalni separator ili Koristi zarez (,) kao decimalni separator.
Kada je decimalni separator tačka (.
), hiljadu separatora može biti izostavljeno, i može se koristiti zarez (,
) ili razmak. Na primer:
- 1234.56
- 1,234.56
- 1 234.56
Kada je decimalni separator zarez (,
), hiljadu separatora ili razmaka se može izostaviti. Na primer:
- 1234,56
- 1 234.56
Sledeći korak
Obučite i objavite svoj model obrada dokumenata
Srodne informacije
Obuka: Obradite prilagođene dokumente sa AI Builder (modulom)