Delen via


Datums en getallen extraheren uit documenten

Hoewel veel te extraheren velden eenvoudige teksten zijn, zijn er gevallen waarin de te extraheren informatie een datum of een getal inclusief bedragen is.

Het importeren van deze gegevens naar een doelsysteem kan omslachtig zijn en vereist aanzienlijk aangepaste conversielogica. De meeste importconnectoren en API's accepteren alleen genormaliseerde datums in ISO 8601-indeling zoals YYYY-MM-DD. Ze accepteren ook alleen getallen met een punt (.) als decimaalteken, zonder een scheidingsteken voor duizendtallen als NNN.DD.

Ga voor meer informatie over datumnotatie naar Datum- en tijdnotatie van ISO 8601.

We hebben de mogelijkheid toegevoegd om dit type te declareren tijdens de veldaanmaakstap van de wizard en om een datum- of getalconventie te kiezen (equivalent aan een landinstelling).

Datumconventies

In het volgende voorbeeld ziet u een hypotheekafschrift met een datumveld.

Schermopname van het 'Datumveld' in het 'Overzicht'.

Het volgende voorbeeld toont datumveldindelingen.

Schermopname van de indeling 'Datumveld'.

Ondersteunde datumnotaties

Kies bij het definiëren van het veld uit Jaar, maand, dag, Maand, dag, jaar of Dag, maand, jaar.

De volgende tekens kunnen worden gebruikt als datumscheidingstekens: ,-/.\. Spatie kan niet als scheidingsteken worden gebruikt. Bijvoorbeeld:

  • 01,01,2020
  • 01-01-2020
  • 01-01-2020

De dag en de maand kunnen elk worden geschreven als een of twee cijfers en het jaar kan uit twee of vier cijfers bestaan:

  • 1-1-2020
  • 01-1-20

Als een datumreeks uit acht cijfers bestaat, is het scheidingsteken optioneel:

  • 01012020
  • 01-01-2020

De maand kan ook worden geschreven als de volledige of korte naam. Als de naam wordt gebruikt, zijn scheidingstekens optioneel. Deze notatie wordt echter mogelijk minder nauwkeurig herkend dan andere.

  • 01-jan-2020
  • 01jan2020
  • 01 jan 2020

Nummerconventies

In het volgende voorbeeld ziet u een hypotheekafschrift met een nummerveld.

Schermopname van het 'Nummerveld' in het 'Overzicht'.

Het volgende voorbeeld toont nummerveldindelingen.

Schermopname van de 'Nummerveld'-indelingen

Notitie

Voor elk veld is slechts één conventie toegestaan voor een bepaald veld voor alle collecties van dit model. Als u bijvoorbeeld een veldbedrag extraheert door Punt (,) gebruiken als decimaalteken te selecteren, wordt 1234,56 of 1 234,56 geconverteerd naar 1234.56. Bedragen met de notatie 12,34,576.78 en 1,234.56 worden niet geconverteerd.

Tijdens de extractie wordt de tekst automatisch geconverteerd volgens de opgegeven conventie. Deze geconverteerde waarde kan worden opgehaald met behulp van het YOURFIELDNAME value-resultaat. Deze waarde is leeg als de conversie niet mogelijk is. Met behulp van het YOURFIELDNAME text-resultaat kan de originele tekst worden opgehaald.

Ondersteunde getalnotaties

Kies bij het definiëren van het veld voor Punt (.) als decimaal scheidingsteken gebruiken of Komma (,) als decimaal scheidingsteken gebruiken.

Als het decimaalteken een punt is (.), kunnen scheidingstekens voor duizendtallen worden weggelaten en kan een komma (,) of witruimte worden gebruikt. Bijvoorbeeld:

  • 1234.56
  • 1,234.56
  • 1 234.56

Als het decimaal scheidingsteken een komma is (,), kunnen scheidingstekens voor duizendtallen of spaties worden weggelaten. Bijvoorbeeld:

  • 1234,56
  • 1 234.56

Volgende stap

Het model voor documentverwerking trainen en publiceren

Training: Aangepaste documenten verwerken met AI Builder (module)