Az Microsoft Syntex modelltípusainak áttekintése

Cikk
11/22/2024

^{A következőkre vonatkozik: ✓ Minden egyéni modell | ✓ Minden előre összeállított modell}

A Microsoft Syntex tartalmainak megértése a dokumentumfeldolgozási modellekkel kezdődik. A dokumentumfeldolgozási modellek segítségével azonosíthatja és osztályozhatja a SharePoint-dokumentumtárakba feltöltött dokumentumokat, majd kinyerheti a szükséges információkat az egyes fájlokból.

SharePoint-dokumentumtárra alkalmazva a modell egy tartalomtípushoz van társítva, és oszlopokkal rendelkezik a kinyert információk tárolásához. A létrehozott tartalomtípus a SharePoint tartalomtípus-gyűjteményében található. Választhatja azt is, hogy meglévő tartalomtípusokat használ a sémájuk használatához.

A Syntex egyéni modelleket és előre összeállított modelleket használ.

Az egyéni és előre összeállított Syntex-modellek típusait bemutató ábra.

A modellek lehetnek vállalati modellek, amelyek egy tartalomközpontban jönnek létre, vagy a helyi SharePoint-webhelyen létrehozott helyi modellek.

Egyéni modellek

A választott egyéni modell típusa a használt fájltípusoktól, a fájlok formátumától és szerkezetétől, valamint a modell alkalmazási területétől függ.

Az egyéni modellek a következők:

Strukturálatlan dokumentumfeldolgozás
Freeform document processing
Strukturált dokumentumfeldolgozás

Az egyéni modellek egymás melletti különbségeit az Egyéni modellek összehasonlítása című cikkben tekintheti meg.

Strukturálatlan dokumentumfeldolgozás

A strukturálatlan dokumentumfeldolgozási modell használatával automatikusan besorolhatja a dokumentumokat, és információkat nyerhet ki belőlük. Strukturálatlan dokumentumokkal, például levelekkel vagy szerződésekkel működik a legjobban. Ezeknek a dokumentumoknak olyan szövegekkel kell rendelkezniük, amelyek kifejezések vagy minták alapján azonosíthatók. Az azonosított szöveg a fájl típusát (besorolását) és a kinyerni kívánt fájltípust (a kinyerőit) is kijelöli.

Strukturálatlan dokumentum lehet például egy szerződésmegújítási levél, amely különböző módokon írható. Az egyes szerződésmegújítási dokumentumok törzsében azonban következetesen vannak információk, például a "Szolgáltatás kezdési dátuma" szöveges sztring, amelyet egy tényleges dátum követ.

Ez a modelltípus a fájltípusok legszélesebb körét támogatja, és több mint 40 nyelvet támogat.

Strukturálatlan dokumentumfeldolgozási modell létrehozásakor használja az Egyosztályos modell lehetőséget.

További információ: Strukturálatlan dokumentumfeldolgozás áttekintése.

Freeform document processing

A szabadkézett dokumentumfeldolgozási modell használatával automatikusan kinyerhet információkat strukturálatlan és szabadkézett dokumentumokból, például levelekből és szerződésekből, ahol az információk bárhol megjelenhetnek a dokumentumban.

A szabadkézi dokumentumfeldolgozási modellek a Microsoft Power Apps AI Builder használatával hoznak létre és tanítanak be modelleket a Syntexben.

Megjegyzés:

A freeform dokumentumfeldolgozási modell néhány régióban még nem érhető el. További információ: Szolgáltatás rendelkezésre állása régiónként.

Mivel a szervezet nagy mennyiségben kap leveleket és dokumentumokat különböző forrásokból, például levelekből, faxokból és e-mailekből, ezeknek a dokumentumoknak a feldolgozása és az adatbázisokba való manuális bevitele jelentős időt vehet igénybe. Azáltal, hogy AI használatával kinyeri a szöveget és más információkat ezekből a dokumentumokból, ez a modell automatizálja ezt a folyamatot.

Ez a modelltípus a pdf- vagy képfájlokban lévő dokumentumok esetében a legjobb megoldás, ha nincs szükség a dokumentumtípus automatikus besorolására, és több mint 40 nyelvet támogat.

Amikor szabadkérelmű dokumentumfeldolgozási modellt hoz létre, használja a Szabadkérelmű kinyerési modell lehetőséget.

További információ: A strukturált és szabadkéményes dokumentumok feldolgozásának áttekintése.

Strukturált dokumentumfeldolgozás

A strukturált dokumentumfeldolgozási modell használatával automatikusan azonosíthatja a mező- és táblaértékeket. Strukturált vagy részben strukturált dokumentumok, például űrlapok és számlák esetén működik a legjobban.

A strukturált dokumentumfeldolgozási modellek a Microsoft Power Apps AI Builder dokumentumfeldolgozási (korábbi nevén űrlapfeldolgozási) használatával hoznak létre és tanítanak be modelleket a Syntexben.

Ez a modelltípus a nyelvek legszélesebb körét támogatja, és betanított az űrlap elrendezésének megértésére példadokumentumokból, majd megtanulja megkeresni a hasonló helyekről kinyerni kívánt adatokat. Forms általában strukturáltabb elrendezéssel rendelkeznek, ahol az entitások ugyanazon a helyen találhatók (például egy adóűrlap társadalombiztosítási száma).

Strukturált dokumentumfeldolgozási modell létrehozásakor használja a Strukturált kinyerési modell lehetőséget.

További információ: A strukturált és szabadkéményes dokumentumok feldolgozásának áttekintése.

Előre összeállított modellek

Ha nem kell egyéni modellt létrehoznia, használhat egy előre összeállított dokumentumfeldolgozási modellt , amely már be van tanítva adott strukturált dokumentumokhoz.

Az előre összeállított modellek a következők:

Szerződésfeldolgozás
Számlafeldolgozás
Nyugtafeldolgozás
Bizalmas adatok feldolgozása
Egyszerű dokumentumfeldolgozás

Az előre összeállított modellek előre be vannak állítva a dokumentumok és a dokumentumok strukturált információinak felismerésére. Ahelyett, hogy teljesen új egyéni modellt kellene létrehoznia, iterálhat egy meglévő előre betanított modellen, hogy a szervezet igényeinek megfelelő mezőket adjon hozzá.

Szerződésfeldolgozás

Az előre összeállított szerződésfeldolgozási modell elemzi és kinyeri a legfontosabb információkat a szerződésdokumentumokból. Az API különböző formátumokban elemzi a szerződéseket, és kinyeri a legfontosabb szerződésadatokat, például az ügyfél vagy a fél nevét, a számlázási címet, a joghatóságot és a lejárati dátumot.

A szerződésfeldolgozási modellekkel kapcsolatos további információkért lásd: Adatok kinyerése szerződésekből előre összeállított modell használatával.

Számlafeldolgozás

Az előre összeállított számlafeldolgozási modell elemzi és kinyeri a legfontosabb információkat az értékesítési számlákból. Az API különböző formátumokban elemzi a számlákat, és kinyeri a legfontosabb számlaadatokat, például az ügyfél nevét, a számlázási címet, a határidőt és a fizetendő összeget.

A számlafeldolgozási modellekkel kapcsolatos további információkért lásd: Adatok kinyerése számlákból előre összeállított modell használatával.

Nyugtafeldolgozás

Az előre összeállított nyugtafeldolgozási modell elemzi és kinyeri a fő információkat az értékesítési nyugtákból. Az API elemzi a nyomtatott és kézzel írt nyugtákat, és kinyeri a fő nyugtaadatokat, például a kereskedő nevét, a kereskedő telefonszámát, a tranzakció dátumát, az adót és a tranzakciók összegét.

További információ a nyugtafeldolgozási modellekről: Adatok kinyerése a nyugtákból előre összeállított modellel.

Bizalmas adatok feldolgozása

Az előre összeállított bizalmasadat-feldolgozási modell elemzi, észleli és kinyeri a kulcsfontosságú információkat a dokumentumokból. Az API különböző formátumban elemzi a szerződéseket, és kinyeri a legfontosabb bizalmas információkat, például a társadalombiztosítási számokat, a pénzügyi számlaszámokat, a jogosítványok azonosítószámait és egyéb személyes adatokat.

A bizalmas információfeldolgozási modellekről további információt az Előre összeállított modell használata a dokumentumokból származó bizalmas információk észleléséhez című témakörben talál.

Egyszerű dokumentumfeldolgozás

Az előre összeállított egyszerű dokumentumfeldolgozási modell rugalmas, előre betanított megoldást kínál kulcs-érték párok, kijelölési jelek és nevesített entitások alapszintű strukturált dokumentumokból való kinyeréhez. A rögzített sémákkal rendelkező többi előre összeállított modelltől eltérően ez a modell képes azonosítani azokat a kulcsokat, amelyeket mások kihagyhatnak, és értékes alternatívát kínál az egyéni modellek címkézése és betanítása helyett. Ez a modell a vonalkódokat és a nyelvfelismerést is támogatja.

Az egyszerű dokumentumfeldolgozási modellekről további információt az Előre összeállított modell használata a dokumentumokból származó bizalmas információk észleléséhez című témakörben talál.

Megosztás a következőn keresztül: