Comparteix a través de


Reconeixement de text model predefinit

El model predefinit de Reconeixement de text extreu paraules de documents i imatges en fluxos de caràcters llegibles per màquina. Utilitza el reconeixement òptic de caràcters (OCR) d'última generació per detectar text imprès i escrit a mà en imatges.

Aquest model processa imatges i fitxers de documents per extreure línies de text imprès o manuscrit.

Ús al Power Apps

El model predefinit de Reconeixement de text està disponible mitjançant Power Apps el component de reconeixement de text. Més informació: Utilitzar el component de reconeixement de text a Power Apps

Ús al Power Automate

Per obtenir informació sobre com utilitzar aquest model, vegeu Power Automate Utilitzar el model predefinit de Reconeixement de text en Power Automate.

Idioma, format i mida admesos

Els fitxers que podeu escanejar amb el model de Reconeixement de text han de tenir aquestes característiques:

  • Idioma per al text imprès: afrikaans, albanès, angika (devanagiri), àrab, asturià, awadhi-hindi (devanagiri), azerbaidjanès (llatí), bagheli, basc, bielorús (ciríl·lic), bielorús (llatí), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosnià (llatí), brajbha, bretó, búlgar, bundeli, buriat (ciríl·lic), català, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), xinès (simplificat), xinès (tradicional), còrnic, cors, tàtar de Crimea (llatí), croat, txec, danès, dari, dhimal (devanagiri), dogri (devanagiri), neerlandès, anglès, erzya (ciríl·lic), estonià, feroès, fijià, filipí, finès, francès, friülà, gagaús (llatí), gallec, alemany, gilbertès, gondi (devanagiri), groenlandès, gurung (devanagiri), crioll haitià, halbi (devanagiri), hani, haryanvi, hawaià, hindi, hmong daw (llatí), ho(devanagiri), hongarès, islandès, inari sami, indonesi, interlinguat, inuktitut (llatí), irlandès, italià, japonès, jaunsari (devanagiri), javanès, Kabuverdianu, Kachin (llatí), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (ciríl·lic), Kara-Kalpak (llatí), Kashubià, Kazakh (ciríl·lic), kazakh (llatí), Khaling, Khasi, K'iche', coreà, korku, koryak, kosraean, kumyk (ciríl·lic), kurd (àrab), kurd (llatí), kurukh (devanagiri), kirguis (ciríl·lic), lakota, llatí, lituà, baix sòrbic, lule sami, luxemburguès, mahasu pahari (devanagiri), malai (llatí), maltès, malto (devanagiri), manx, maori, marathi, mongol (ciríl·lic), Montenegro (ciríl·lic), montenegrino (llatí), napolità, nepalès, niueà, nogay, sami del nord (llatí), noruec, occità, ossètic, paixtu, persa, polonès, portuguès, panjabi (àrab), ripuari, romanès, rus, sadri (devanagiri), samoà (llatí), sànscrit (devanagari), sanadhí (devanagiri), escocès, gaèlic escocès, serbi (llatí), xerpa (devanagiri), sirmauri (devanagiri), sami skolt, eslovac, eslovè, somali (àrab), sami del sud, espanyol, swahili (llatí), suec, tadjik (ciríl·lic), tàrtar (llatí), tetum, thangmi, tongan, turc, turcman (llatí), tuvan, sorbià superior, urdú, uigur (àrab), uzbek (àrab), uzbek (ciríl·lic), uzbek (llatí), volapük, walser, gal·lès, frisó occidental, maia yucatec, zhuang, zulu
  • Idioma del text manuscrit: anglès, xinès (simplificat), francès, alemany, italià, japonès, coreà, portuguès, espanyol
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Mida: 20 MB màxim
  • Per als documents PDF, només es processen les primeres 2.000 pàgines.

Sortida del model

Si es detecta un document, el model de Reconeixement de text genera la informació següent:

  • Resultats: Una llista de línies extretes del text d'entrada.
  • Text: cadenes que contenen la línia de text detectada.
  • BoundingBox: Quatre valors que representen el quadre delimitador, descrits utilitzant les posicions superior i esquerra juntament amb la seva amplada i alçada.

Límits

Acció Límit Termini de renovació
Reconeixement de text (per entorn) 480 60 segons

Formació: Reconèixer text amb AI Builder (mòdul)