Делите путем


Екстракт датуме и бројеве из докумената

Иако су многа поља која треба издвојити једноставни текстови, постоје случајеви у којима је информација за издвајање датум или број, укључујући износе.

Увоз ових података у циљни систем може бити гломазан, захтевајући значајну прилагођену логику конверзије. Већина конектора за увоз и АПИ-ја прихвата само нормализоване датуме у ИСО 8601 формату као што су YYYY-MM-DD. Они такође прихватају само бројеве који користе тачку ( .) као децимални сепаратор без хиљаду сепаратора као NNN.DD.

Да бисте сазнали више о формату датума, идите на ИСО 8601 Формат датума и времена.

Додали смо могућност да декларишете овај тип током корак за креирање поља чаробњака, и да изаберете конвенцију датума или броја (еквивалентно локалу).

Датумске конвенције

Следећи пример приказује изјаву о хипотеки са датумом поља.

Снимак екрана'Дате поља' у 'Преглед'.

Следећи пример приказује формате поља датума.

Снимак екрана формата'Поље датума'.

Подржани формати датума

Приликом дефинисања поља, изаберите између године, месеца, дана ; Месец, дан, година ; или дан, месец, година.

Следећи знакови се могу користити као раздјелници датума: ,-/.\ Размак се не може користити као раздјелник. На пример:

  • 01,01,2020.
  • 01-01-2020
  • 01/01/2020

Дан и месец могу се написати као једна или две цифре, а година може бити две или четири цифре:

  • 1-1-2020
  • 1-01-20

Ако стринг датума има осам цифара, раздјелник је опцион:

  • 01012020.
  • 01 01 2020

Месец се такође може написати као његово пуно или кратко име. Ако се користи име, раздјелнички знакови су опциони. Међутим, овај формат може бити препознат мање прецизно од других.

  • 01 јан / 2020
  • Влајковићева 2020
  • У.бр.12/2020

Бројчане конвенције

Следећи пример приказује хипотека изјаву са бројем поља.

Снимак екрана

Следећи пример приказује формате поља бројева.

Снимак екрана формата 'Поље за бројеве'.

Белешка

За свако поље, дозвољена је само једна конвенција за одређено поље за све колекције овог модела. На пример, ако извучете количину поља тако што ћете изабрати Користи зарез (,) као децимални сепаратор , следећи текст 1234,56 или 1 234,56 се претвара у 1234.56. Износи са форматом #пии_ииииииијјз или 1,234.56 се не конвертују.

Током екстракције, текст се аутоматски претвара у складу са предвиђеном конвенцијом. Ова конвертована вредност може се преузети помоћу резултата YOURFIELDNAME value . Ова вредност је празна ако конверзија није могућа. Оригинални текст се може преузети помоћу резултата YOURFIELDNAME text .

Подржани формати бројева

Када дефинишете поље, изаберите или Користи тачку (.) као децимални сепаратор или Користи зарез (,) као децимални сепаратор.

Када је децимални сепаратор тачка ( .), хиљаду сепаратора може бити изостављено, и може се користити зарез ( ,) или размак. На пример:

  • 1234.56.
  • 1,234.56.
  • 1 234.56

Када је децимални сепаратор зарез ( ,), хиљаду сепаратора или размака се може изоставити. На пример:

  • 1234,56.
  • 1 234.56

Следећи корак

Тренирајте и објавите свој < ДИЦТ__обрада докумената > доцумент процессинг модел

Обука : Обрадите прилагођене документе са AI Builder (модулом)