Extreu dates i números de documents
Tot i que molts camps a extreure són textos senzills, hi ha casos en què la informació a extreure és una data o un número que inclou quantitats.
La importació d'aquestes dades a un sistema de destinació pot ser complicada i requereix una lògica de conversió personalitzada important. La majoria dels connectors d'importació i API només accepten dates normalitzades en format ISO 8601 com YYYY-MM-DD
. També accepten només nombres que utilitzen el punt (.
) com a separador decimal sense un separador de milers com NNN.DD
.
Per obtenir més informació sobre el format de data, aneu a ISO 8601 Format de data i hora.
Hem afegit la possibilitat de declarar aquest tipus durant el pas de creació de camps de l'auxiliar i de triar una convenció de data o número (equivalent a una configuració regional).
Convencions de dates
L'exemple següent mostra un extracte d'hipoteca amb un camp de data.
L'exemple següent mostra els formats de camp de data.
Formats de data admesos
Quan definiu el camp, trieu entre Any, Mes, Dia; mes, dia, any; o dia, mes, any.
Els següents caràcters es poden utilitzar com a delimitadors de dates: ,
-
/
.
\
. L'espai en blanc no es pot utilitzar com a delimitador. Per exemple:
- 01,01,2020
- 01-01-2020
- 01/01/2020
El dia i el mes es poden escriure cadascun com un o dos dígits, i l'any pot ser de dos o quatre dígits:
- 1-1-2020
- 1-01-20
Si una cadena de data té vuit dígits, el delimitador és opcional:
- 01012020
- 01 01 2020
El mes també es pot escriure com el seu nom complet o curt. Si s'utilitza el nom, els caràcters delimitadors són opcionals. No obstant això, aquest format pot ser reconegut amb menys precisió que altres.
- 01/gener/2020
- 01 de gener de 2020
- 01 de gener de 2020
Convencions numèriques
L'exemple següent mostra un extracte d'hipoteca amb camps numèrics.
L'exemple següent mostra els formats de camp numèric.
Nota
Per a cada camp, només es permet una convenció per a un camp determinat per a totes les col·leccions d'aquest model. Per exemple, si extreu un import de camp seleccionant Utilitza la coma (,) com a separador decimal, el text següent 1234,56 o 1 234,56 es converteix en 1234,56. Els imports amb el format 12,34,576.78 o 1.234,56 no es converteixen.
Durant l'extracció, el text es converteix automàticament segons la convenció proporcionada. Aquest valor convertit es pot recuperar utilitzant el YOURFIELDNAME value
resultat. Aquest valor està buit si la conversió no és possible. El text original es pot recuperar mitjançant el YOURFIELDNAME text
resultat.
Formats numèrics admesos
Quan definiu el camp, trieu Utilitza el punt (.) com a separador decimal o Utilitza la coma (,) com a separador decimal.
Quan el separador decimal és un punt (.
), es poden ometre separadors de milers i es pot utilitzar una coma (,
) o un espai en blanc. Per exemple:
- 1234.56
- 1,234.56
- 1 234.56
Quan el separador decimal és una coma (,
), es poden ometre separadors de milers o espais en blanc. Per exemple:
- 1234,56
- 1 234.56
Pas següent
Entrenar i publicar el model de processament de documents
Informació relacionada
Formació: Processar documents personalitzats amb AI Builder (mòdul)