Reconeixement de text model predefinit
El model predefinit de Reconeixement de text extreu paraules de documents i imatges en fluxos de caràcters llegibles per màquina. Utilitza el reconeixement òptic de caràcters (OCR) d'última generació per detectar text imprès i escrit a mà en imatges.
Aquest model processa imatges i fitxers de documents per extreure línies de text imprès o manuscrit.
Ús al Power Apps
El model predefinit de Reconeixement de text està disponible mitjançant Power Apps el component de reconeixement de text. Més informació: Utilitzar el component de reconeixement de text a Power Apps
Ús al Power Automate
Per obtenir informació sobre com utilitzar aquest model, vegeu Power Automate Utilitzar el model predefinit de Reconeixement de text en Power Automate.
Idioma, format i mida admesos
Els fitxers que podeu escanejar amb el model de Reconeixement de text han de tenir aquestes característiques:
- Idioma per al text imprès: afrikaans, albanès, angika (devanagiri), àrab, asturià, awadhi-hindi (devanagiri), azerbaidjanès (llatí), bagheli, basc, bielorús (ciríl·lic), bielorús (llatí), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosnià (llatí), brajbha, bretó, búlgar, bundeli, buriat (ciríl·lic), català, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), xinès (simplificat), xinès (tradicional), còrnic, cors, tàtar de Crimea (llatí), croat, txec, danès, dari, dhimal (devanagiri), dogri (devanagiri), neerlandès, anglès, erzya (ciríl·lic), estonià, feroès, fijià, filipí, finès, francès, friülà, gagaús (llatí), gallec, alemany, gilbertès, gondi (devanagiri), groenlandès, gurung (devanagiri), crioll haitià, halbi (devanagiri), hani, haryanvi, hawaià, hindi, hmong daw (llatí), ho(devanagiri), hongarès, islandès, inari sami, indonesi, interlinguat, inuktitut (llatí), irlandès, italià, japonès, jaunsari (devanagiri), javanès, Kabuverdianu, Kachin (llatí), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (ciríl·lic), Kara-Kalpak (llatí), Kashubià, Kazakh (ciríl·lic), kazakh (llatí), Khaling, Khasi, K'iche', coreà, korku, koryak, kosraean, kumyk (ciríl·lic), kurd (àrab), kurd (llatí), kurukh (devanagiri), kirguis (ciríl·lic), lakota, llatí, lituà, baix sòrbic, lule sami, luxemburguès, mahasu pahari (devanagiri), malai (llatí), maltès, malto (devanagiri), manx, maori, marathi, mongol (ciríl·lic), Montenegro (ciríl·lic), montenegrino (llatí), napolità, nepalès, niueà, nogay, sami del nord (llatí), noruec, occità, ossètic, paixtu, persa, polonès, portuguès, panjabi (àrab), ripuari, romanès, rus, sadri (devanagiri), samoà (llatí), sànscrit (devanagari), sanadhí (devanagiri), escocès, gaèlic escocès, serbi (llatí), xerpa (devanagiri), sirmauri (devanagiri), sami skolt, eslovac, eslovè, somali (àrab), sami del sud, espanyol, swahili (llatí), suec, tadjik (ciríl·lic), tàrtar (llatí), tetum, thangmi, tongan, turc, turcman (llatí), tuvan, sorbià superior, urdú, uigur (àrab), uzbek (àrab), uzbek (ciríl·lic), uzbek (llatí), volapük, walser, gal·lès, frisó occidental, maia yucatec, zhuang, zulu
- Idioma del text manuscrit: anglès, xinès (simplificat), francès, alemany, italià, japonès, coreà, portuguès, espanyol
- Format:
- JPG
- PNG
- BMP
- Mida: 20 MB màxim
- Per als documents PDF, només es processen les primeres 2.000 pàgines.
Sortida del model
Si es detecta un document, el model de Reconeixement de text genera la informació següent:
- Resultats: Una llista de línies extretes del text d'entrada.
- Text: cadenes que contenen la línia de text detectada.
- BoundingBox: Quatre valors que representen el quadre delimitador, descrits utilitzant les posicions superior i esquerra juntament amb la seva amplada i alçada.
Límits
Acció | Límit | Termini de renovació |
---|---|---|
Reconeixement de text (per entorn) | 480 | 60 segons |