Comparteix a través de


Requisits i limitacions per a un model de processament de documents

Idiomes admesos

Model per a documents de plantilla fixa

Els idiomes següents s'admeten quan s'entrena un model de processament de documents i se seleccionen documents de plantilla fixa com a tipus de document:

Abaza, Abkhaz, Achinès, Acoli, Adangme, Adiguhe, Àfar, Afrikaans, Akan, Albanès, Algonquí, Angika (Devanagari), Àrab, Asturià, Asu (Tanzània), Àvar, Awadhi-Hindi (Devanagari), Aymara, Àzeri (llatí), Bafia, Bagheli, Bambara, Bashkir, Basc, Bielorús (ciríl·lic), Bielorús (llatí), Bemba (Zàmbia), Bemba (Zàmbia), Bhojpuri-Hindi (Devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), Bosnià (llatí), Brajbha, Bretó, Búlgar, Bundeli, Buriat (ciríl·lic), Català, Cebuà, Chamling, Chamorro, txetxè, chhattisgarhi (devanagari), chiga, xinès simplificat, xinès tradicional, choctaw, txukot, txuvaix, còrnic, cors, cree, creek, tàtar de Crimea (llatí), croat, corb, txec, danès, dargwa, dari, dhimal (devanagari), dogri (devanagari), duala, dungan, holandès, efik, anglès, erzya (ciríl·lic), estonià, feroès, fijià, filipí, finès, fon, francès, friülà, ga, gagaús (llatí), gallec, ganda, gayo, alemany, gilbertès, gondi (devanagari), grec, groenlandès, guaraní, gurung (devanagari), gusii, crioll haitià, halbi (devanagari), hani, haryanvi, hawaià, hebreu, herero, hiligaynon, hindi, hmong daw (llatí), ho (devanagiri), hongarès, iban, islandès, igbo, iloko, inari sami, indonesi, ingúix, interlingua, inuktitut (llatí), irlandès, italià, japonès, jaunsari (devanagari), javanès, jola-fonyi, kabardí, kabuverdianu, kachin (llatí), kalenjin, calmuc, kangri (devanagari), kanuri, karatxai-balkar, kara-kalpak (ciríl·lic), kara-kalpak (llatí), caixubi, kazakh (ciríl·lic), kazakh (llatí), khakas, khaling, khasi, k'iche', kikuyu, kildin sami, kinyarwanda, komi, kongo, coreà, korku, koriak, kosraeu, kpelle, kuanyama, kumyk (ciríl·lic), kurd (àrab), kurd (llatí), kurukh (devanagari), kirguís (ciríl·lic), lak, lakota, llatí, letó, lezghià, lingala, lituà, baix sòrab, lozi, sami de Lule, luo (Kenya i Tanzània), luxemburguès, luyia luy, macedoni, machame, madurès, mahasu pahari (devanagari), Makhuwa-Meetto, Makonde, Malgaix, Malai (llatí), Maltès, Malto (Devanagari), Mandinga, Manx, Maori, Mapudungun, Marathi, Mari (Rússia), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, Mongol (ciríl·lic), Mongondow, Montenegrí (ciríl·lic), Montenegrí (llatí), Morisyen, Mundang, Nàhuatl, Navajo, Ndonga, Napolità, Nepalès, Ngomba, Niueà, Nogay, Ndebele Septentrional, Sami Septentrional (llatí), Noruec, Nyanja, Nyankole, Nzima, Occità, Ojibwa, Oromo, Ossètic, Pampanga, Pangasinan, Papiamento, Paixtu, Pedi, Persa, Polonès, Portuguès, Panjabi (àrab), Quítxua, Ripuari, Romanès, Romanx, Rundi, Rus, Rwa, Sadri (Devanagari), Sakhà, Samburu, Samoà (llatí), Sango, Sangu (Gabon), Sànscrit (Devanagari), Santali(Devanagiri), Escocès, Gaèlic escocès, Sena, Serbi (ciríl·lic), Serbi (llatí), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Devanagari), Skolt Sami, Eslovac, Eslovè, Soga, Somali (àrab), Somali (llatí), Songhai, Ndebele meridional, Altai meridional, Sami meridional, sotho meridional, castellà, sundanès, suahili (llatí), suati, suec, tabassaran, tachelhit, tahitià, taita, tadjik (ciríl·lic), tàmil, tàtar (ciríl·lic), tàtar (llatí), teso, tetum, tailandès, thangmi, tok pisin, tongan, tsonga, tswana, turcman, turcman (llatí), tuvà, udmurt, uigur (ciríl·lic), ucraïnès, alt sòrab, urdú, uigur (àrab), uzbek (àrab), uzbek (ciríl·lic), uzbek (llatí), vietnamita, volapük, vunjo, walser, gal·lès, frisó occidental, Wòlof, Xhosa, maia yucateca, zapoteca, zarma, zhuang, zulu

Model de documents generals

S'admeten els idiomes següents quan es forma un model de processament de documents i se seleccionen documents generals com a tipus de document.

Afrikaans, albanès, àrab, búlgar, xinès (Han (variant simplificada)), xinès (Han (variant tradicional)), croat, txec, danès, holandès, estonià, finès, francès, alemany, hebreu, hindi, hongarès, indonesi, italià, japonès, coreà, letó, lituà, macedoni, marathi, grec modern (1453-), nepalès (macrollengua), noruec, panjabi, persa, polonès, portuguès, romanès, rus, eslovac, eslovè, somali (àrab), somali (llatí), espanyol, suahili (macroidioma), suec, Tàmil, Tailandès, Turc, Ucraïnès, Urdú, Vietnamita

Requisits

Obres de tractament documental sobre documents d'entrada que compleixin els requisits següents:

  • Format JPG, PNG o PDF (text o escanejat). Els PDF incrustats de text són millors, perquè no hi haurà errors en l'extracció i la ubicació de caràcters.
  • Els fitxers TIFF no es poden utilitzar per a la formació. Haureu d'utilitzar documents en format PDF, JPG o PNG per entrenar un model. Un cop entrenat el model, pot extreure dades dels fitxers TIFF quan el model s'utilitza en un Power Automate flux de núvol.
  • Si els PDF estan bloquejats amb contrasenya, has d'eliminar el cadenat abans d'enviar-los.
  • La mida màxima del document a processar no ha de superar els 20 MB.
  • Per a les imatges, les dimensions han de tenir entre 50 × 50 i 10.000 × 10.000 píxels.
  • Si s'escaneja des de documents en paper, les exploracions han de ser imatges d'alta qualitat.
  • Podeu crear fins a 200 col·leccions per model.
  • En un flux de núvol, el límit de camps que es poden etiquetar per al processament de documents és de 300.

Nota

  • Actualment no s'admet l'extracció de signatures de documents.
  • Actualment no s'admeten els camps que es divideixen entre els límits de la pàgina.
  • Actualment no s'admeten les files que passen d'una pàgina a una altra.

Consell d'optimització

Aprendre a millorar el rendiment dels models de tractament documental.

Pas següent

Crear un model de processament de formularis