Dátumok és számok kivonása dokumentumokból
Bár sok kinyerendő mező egyszerű szöveg, vannak olyan esetek, amikor a kinyerendő információ egy dátum vagy egy szám, beleértve az összegeket is.
Az adatok célrendszerbe való importálása nehézkes lehet, és jelentős egyéni konverziós logikát igényelhet. A legtöbb importálási összekötő és API csak ISO 8601 formátumú normalizált dátumokat fogad el, például YYYY-MM-DD
. Ezenkívül csak olyan számokat fogadnak el, amelyek pont (.
) tizedeselválasztóként vannak elválasztva, ezreselválasztó nélkül NNN.DD
.
Ha többet szeretne megtudni a dátumformátumról, látogasson el az ISO 8601 Dátum- és időformátum oldalra.
Mostantól deklarálható ez a típus a varázsló mezőlétrehozási lépés során, és dátum- vagy számkonvenciót választhat (egyenértékű a területi beállítással).
Dátumkonvenciók
A következő példa egy dátummezőt tartalmazó jelzálogszámlakivonatot mutat be.
Az alábbi példa a dátummezők formátumát mutatja be.
Támogatott dátumformátumok
A mező meghatározásakor válasszon az Év, Hónap, Nap; hónap, nap, év; vagy nap, hónap, év.
A következő karakterek használhatók dátumhatárolóként: ,
-
/
.
\
A szóköz nem használható határolójelként. Például:
- 01,01,2020.
- 01-01-2020
- 01/01/2020
A nap és a hónap egy vagy két számjegyből állhat, az év pedig két vagy négy számjegyből állhat:
- 1-1-2020
- 1-01-20
Ha egy dátumkarakterlánc nyolc számjegyből áll, az elválasztójel megadása nem kötelező:
- 01012020.
- 01 01 2020
A hónap teljes vagy rövid névként is írható. Ha a nevet használja, az elválasztó karakterek megadása nem kötelező. Ez a formátum azonban kevésbé pontosan felismerhető, mint mások.
- 01/január/2020
- 01Jan2020
- 01 január 2020
Számkonvenciók
A következő példa egy jelzálogszámlakivonatot mutat be számmezőkkel.
Az alábbi példa a számmezők formátumát mutatja be.
Feljegyzés
Minden mezőhöz csak egy konvenció engedélyezett egy adott mezőhöz a modell összes gyűjteményéhez. Ha például a vessző (,) használata tizedesjelként lehetőség kiválasztásávalnyer ki egy mezőösszeget, a következő 1234,56 vagy 1 234,56 szöveget a program 1234,56-ra konvertálja. A 12,34,576.78 vagy 1 234,56 formátumú összegek nem konvertálódnak.
A kinyerés során a szöveg automatikusan átalakul a megadott konvenciónak megfelelően. Ez az átalakított érték az YOURFIELDNAME value
eredmény segítségével visszakereshető. Ez az érték üres, ha a konverzió nem lehetséges. Az eredeti szöveg visszakereshető az YOURFIELDNAME text
eredmény felhasználásával.
Támogatott számformátumok
A mező definiálásakor válassza a Pont (.) használata tizedesjelként vagy a Vessző (,) használata tizedesjelként lehetőséget.
Ha a tizedeselválasztó pont (),.
az ezreselválasztók elhagyhatók, és vessző (,
) vagy szóköz használható. Például:
- 1234.56.
- 1,234.56.
- 1 234.56
Ha a tizedeselválasztó vessző (,
), az ezreselválasztók vagy szóközök elhagyhatók. Például:
- 1234,56.
- 1 234.56
Következő lépés
A dokumentumfeldolgozás modell betanítása és közzététele
Kapcsolódó információk
Oktatás: Egyéni dokumentumok feldolgozása a következővel AI Builder (modul)