Az Microsoft Syntex modelltípusainak áttekintése
A következőkre vonatkozik: ✓ Minden egyéni modell | ✓ Minden előre összeállított modell
A Microsoft Syntex tartalmainak megértése a dokumentumfeldolgozási modellekkel kezdődik. A dokumentumfeldolgozási modellek segítségével azonosíthatja és osztályozhatja a SharePoint-dokumentumtárakba feltöltött dokumentumokat, majd kinyerheti a szükséges információkat az egyes fájlokból.
SharePoint-dokumentumtárra alkalmazva a modell egy tartalomtípushoz van társítva, és oszlopokkal rendelkezik a kinyert információk tárolásához. A létrehozott tartalomtípus a SharePoint tartalomtípus-gyűjteményében található. Választhatja azt is, hogy meglévő tartalomtípusokat használ a sémájuk használatához.
A Syntex egyéni modelleket és előre összeállított modelleket használ.
A modellek lehetnek vállalati modellek, amelyek egy tartalomközpontban jönnek létre, vagy a helyi SharePoint-webhelyen létrehozott helyi modellek.
Egyéni modellek
A választott egyéni modell típusa a használt fájltípusoktól, a fájlok formátumától és szerkezetétől, valamint a modell alkalmazási területétől függ.
Az egyéni modellek a következők:
- Strukturálatlan dokumentumfeldolgozás
- Freeform document processing
- Strukturált dokumentumfeldolgozás
Az egyéni modellek egymás melletti különbségeit az Egyéni modellek összehasonlítása című cikkben tekintheti meg.
Strukturálatlan dokumentumfeldolgozás
A strukturálatlan dokumentumfeldolgozási modell használatával automatikusan besorolhatja a dokumentumokat, és információkat nyerhet ki belőlük. Strukturálatlan dokumentumokkal, például levelekkel vagy szerződésekkel működik a legjobban. Ezeknek a dokumentumoknak olyan szövegekkel kell rendelkezniük, amelyek kifejezések vagy minták alapján azonosíthatók. Az azonosított szöveg a fájl típusát (besorolását) és a kinyerni kívánt fájltípust (a kinyerőit) is kijelöli.
Strukturálatlan dokumentum lehet például egy szerződésmegújítási levél, amely különböző módokon írható. Az egyes szerződésmegújítási dokumentumok törzsében azonban következetesen vannak információk, például a "Szolgáltatás kezdési dátuma" szöveges sztring, amelyet egy tényleges dátum követ.
Ez a modelltípus a fájltípusok legszélesebb körét támogatja, és több mint 40 nyelvet támogat.
Strukturálatlan dokumentumfeldolgozási modell létrehozásakor használja az Egyosztályos modell lehetőséget.
További információ: Strukturálatlan dokumentumfeldolgozás áttekintése.
Freeform document processing
A szabadkézett dokumentumfeldolgozási modell használatával automatikusan kinyerhet információkat strukturálatlan és szabadkézett dokumentumokból, például levelekből és szerződésekből, ahol az információk bárhol megjelenhetnek a dokumentumban.
A szabadkézi dokumentumfeldolgozási modellek a Microsoft Power Apps AI Builder használatával hoznak létre és tanítanak be modelleket a Syntexben.
Megjegyzés:
A freeform dokumentumfeldolgozási modell néhány régióban még nem érhető el. További információ: Szolgáltatás rendelkezésre állása régiónként.
Mivel a szervezet nagy mennyiségben kap leveleket és dokumentumokat különböző forrásokból, például levelekből, faxokból és e-mailekből, ezeknek a dokumentumoknak a feldolgozása és az adatbázisokba való manuális bevitele jelentős időt vehet igénybe. Azáltal, hogy AI használatával kinyeri a szöveget és más információkat ezekből a dokumentumokból, ez a modell automatizálja ezt a folyamatot.
Ez a modelltípus a pdf- vagy képfájlokban lévő dokumentumok esetében a legjobb megoldás, ha nincs szükség a dokumentumtípus automatikus besorolására, és több mint 40 nyelvet támogat.
Amikor szabadkérelmű dokumentumfeldolgozási modellt hoz létre, használja a Szabadkérelmű kinyerési modell lehetőséget.
További információ: A strukturált és szabadkéményes dokumentumok feldolgozásának áttekintése.
Strukturált dokumentumfeldolgozás
A strukturált dokumentumfeldolgozási modell használatával automatikusan azonosíthatja a mező- és táblaértékeket. Strukturált vagy részben strukturált dokumentumok, például űrlapok és számlák esetén működik a legjobban.
A strukturált dokumentumfeldolgozási modellek a Microsoft Power Apps AI Builder dokumentumfeldolgozási (korábbi nevén űrlapfeldolgozási) használatával hoznak létre és tanítanak be modelleket a Syntexben.
Ez a modelltípus a nyelvek legszélesebb körét támogatja, és betanított az űrlap elrendezésének megértésére példadokumentumokból, majd megtanulja megkeresni a hasonló helyekről kinyerni kívánt adatokat. Forms általában strukturáltabb elrendezéssel rendelkeznek, ahol az entitások ugyanazon a helyen találhatók (például egy adóűrlap társadalombiztosítási száma).
Strukturált dokumentumfeldolgozási modell létrehozásakor használja a Strukturált kinyerési modell lehetőséget.
További információ: A strukturált és szabadkéményes dokumentumok feldolgozásának áttekintése.
Előre összeállított modellek
Ha nem kell egyéni modellt létrehoznia, használhat egy előre összeállított dokumentumfeldolgozási modellt , amely már be van tanítva adott strukturált dokumentumokhoz.
Az előre összeállított modellek a következők:
- Szerződésfeldolgozás
- Számlafeldolgozás
- Nyugtafeldolgozás
- Bizalmas adatok feldolgozása
- Egyszerű dokumentumfeldolgozás
Az előre összeállított modellek előre be vannak állítva a dokumentumok és a dokumentumok strukturált információinak felismerésére. Ahelyett, hogy teljesen új egyéni modellt kellene létrehoznia, iterálhat egy meglévő előre betanított modellen, hogy a szervezet igényeinek megfelelő mezőket adjon hozzá.
Szerződésfeldolgozás
Az előre összeállított szerződésfeldolgozási modell elemzi és kinyeri a legfontosabb információkat a szerződésdokumentumokból. Az API különböző formátumokban elemzi a szerződéseket, és kinyeri a legfontosabb szerződésadatokat, például az ügyfél vagy a fél nevét, a számlázási címet, a joghatóságot és a lejárati dátumot.
A szerződésfeldolgozási modellekkel kapcsolatos további információkért lásd: Adatok kinyerése szerződésekből előre összeállított modell használatával.
Számlafeldolgozás
Az előre összeállított számlafeldolgozási modell elemzi és kinyeri a legfontosabb információkat az értékesítési számlákból. Az API különböző formátumokban elemzi a számlákat, és kinyeri a legfontosabb számlaadatokat, például az ügyfél nevét, a számlázási címet, a határidőt és a fizetendő összeget.
A számlafeldolgozási modellekkel kapcsolatos további információkért lásd: Adatok kinyerése számlákból előre összeállított modell használatával.
Nyugtafeldolgozás
Az előre összeállított nyugtafeldolgozási modell elemzi és kinyeri a fő információkat az értékesítési nyugtákból. Az API elemzi a nyomtatott és kézzel írt nyugtákat, és kinyeri a fő nyugtaadatokat, például a kereskedő nevét, a kereskedő telefonszámát, a tranzakció dátumát, az adót és a tranzakciók összegét.
További információ a nyugtafeldolgozási modellekről: Adatok kinyerése a nyugtákból előre összeállított modellel.
Bizalmas adatok feldolgozása
Az előre összeállított bizalmasadat-feldolgozási modell elemzi, észleli és kinyeri a kulcsfontosságú információkat a dokumentumokból. Az API különböző formátumban elemzi a szerződéseket, és kinyeri a legfontosabb bizalmas információkat, például a társadalombiztosítási számokat, a pénzügyi számlaszámokat, a jogosítványok azonosítószámait és egyéb személyes adatokat.
A bizalmas információfeldolgozási modellekről további információt az Előre összeállított modell használata a dokumentumokból származó bizalmas információk észleléséhez című témakörben talál.
Egyszerű dokumentumfeldolgozás
Az előre összeállított egyszerű dokumentumfeldolgozási modell rugalmas, előre betanított megoldást kínál kulcs-érték párok, kijelölési jelek és nevesített entitások alapszintű strukturált dokumentumokból való kinyeréhez. A rögzített sémákkal rendelkező többi előre összeállított modelltől eltérően ez a modell képes azonosítani azokat a kulcsokat, amelyeket mások kihagyhatnak, és értékes alternatívát kínál az egyéni modellek címkézése és betanítása helyett. Ez a modell a vonalkódokat és a nyelvfelismerést is támogatja.
Az egyszerű dokumentumfeldolgozási modellekről további információt az Előre összeállított modell használata a dokumentumokból származó bizalmas információk észleléséhez című témakörben talál.