Comparteix a través de


Accions de la OCR

Power Automate permet als usuaris llegir, extreure i gestionar dades dins dels fitxers mitjançant el reconeixement òptic de caràcters (OCR).

Per crear un motor OCR i extreure text d'imatges i documents, utilitzeu l'acció Extreu text amb OCR . L'exemple següent extreu text de tota la imatge especificada.

Captura de pantalla del text Extreu amb acció OCR.

Totes les accions OCR poden crear una nova variable de motor OCR o utilitzar-ne una d'existent. Podeu utilitzar variables de motor OCR existents en qualsevol acció que ofereixi capacitats OCR.

Power Automate admet els motors OCR i Tesseract de Windows. Per configurar el motor OCR seleccionat, aneu a la configuració del motor OCR de l'acció adequada. Les opcions disponibles inclouen l'idioma i els multiplicadors d'amplada i alçada de la imatge.

Nota

  • Tots els motors OCR disponibles estan preinstal·lats i funcionen Power Automate localment sense connectar-se al núvol. Tanmateix, és possible que hàgiu de descarregar paquets de llengua o fitxers de dades per extreure textos en idiomes específics.
  • Els multiplicadors d'imatges augmenten la mida de la imatge per fer que la cerca i l'extracció de text siguin més efectives. Establir valors superiors a tres pot conduir a resultats erronis.

Utilitzeu el motor OCR de Windows

El motor OCR predeterminat és Power Automate el motor OCR de Windows. Per extreure textos mitjançant el motor OCR de Windows, heu d'instal·lar el paquet de llengua adequat per a l'idioma que voleu extreure.

Si el paquet de llengua apropiat no està instal·lat, llança un error, Power Automate demanant-li que l'instal·li. Per trobar més informació sobre la descàrrega i instal·lació de paquets de llengua, aneu a Paquets de llengua per a Windows.

Després d'instal·lar el paquet de llengua adequat, amplieu la configuració del motor OCR de l'acció OCR i seleccioneu l'idioma que vulgueu. El motor OCR de Windows admet 25 idiomes, inclosos el xinès (simplificat i tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic i llatí), eslovac, espanyol, suec i turc.

Utilitzeu el motor OCR Tesseract

Nota

Per fer ús del motor OCR Tesseract, assegureu-vos que la CPU de la màquina admeti el conjunt d'instruccions AVX2.

A part del motor OCR de Windows, Power Automate suporta el motor Tesseract. Aquest motor pot extreure text en cinc idiomes sense més configuració: anglès, alemany, espanyol, francès i italià.

Per extreure text en un idioma fora de la llista esmentada, activeu l'opció Utilitza altres idiomes a la configuració del motor OCR de l'acció OCR. Quan aquesta opció està habilitada, l'acció mostra dos paràmetres més: Abreviatura d'idioma i Ruta de dades de llengua.

El camp Abreviatura d'idioma indica al motor quin idioma ha de buscar durant OCR. El camp Camí d'accés de dades d'idioma conté els fitxers de dades d'idioma (.traineddata) utilitzats per entrenar el motor OCR. Podeu trobar els fitxers de dades d'idioma per a tots els idiomes disponibles en aquest repositori de GitHub.

També podeu utilitzar el motor Tesseract per extreure text de documents multilingües. Per obtenir més informació sobre l'extracció de text de documents multilingües, aneu a Realitzar OCR en documents multilingües.

Si el text de la pantalla (OCR)

Marca l'inici d'un bloc condicional d'accions en funció de si un determinat text apareix a la pantalla o no, mitjançant OCR.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Si el text N/A Existeix, No existeix Existeix Especifica si s'ha de comprovar si el text existeix o no a la font indicada per analitzar
Tipus de motor d'OCR No Motor Windows OCR, motor Tesseract, motor OCR variable Variable del motor d'OCR El tipus de motor OCR a utilitzar. Seleccioneu un motor OCR preconfigurat o configureu-ne un de nou.
Variable del motor d'OCR No OCREngineObject Motor que s'ha d'utilitzar per a l'operació d'OCR
Text que cal cercar No Valor del text Text que s'ha de cercar a la font especificada
És una expressió regular N/A Valor booleà Fals Indica si s'ha d'utilitzar una expressió regular per trobar el text especificat
Cerca el text a N/A Pantalla sencera, finestra en primer pla Tota la pantalla Indica si voleu cercar el text especificat a tota la pantalla visible o només a la finestra de primer pla
Mode de cerca N/A Tota la font especificada, només subregió específica, subregió relativa a la imatge Tota la font especificada Especifica si s'ha d'escanejar tota la pantalla (o finestra) o una subregió reduïda d'aquesta
Imatges No Llista d'imatges Imatges que especifiquen la subregió (relativa a la cantonada superior esquerra de la imatge) que s'han d'escanejar per cercar el text proporcionat
X1 Valor numèric Coordenada X inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat
Tolerància Valor numèric 10 Especifica en quin grau poden diferir les imatges cercades de la imatge triada originalment
Y1 Valor numèric Coordenada Y inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat
X1 Valor numèric Coordenada X inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
X2 Valor numèric Coordenada X final de la subregió que s'ha d'escanejar per cercar el text proporcionat
Y1 Valor numèric Coordenada Y inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
Y2 Valor numèric Coordenada Y final de la subregió que s'ha d'escanejar per cercar el text proporcionat
X2 Valor numèric Coordenada X final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
Y2 Valor numèric Coordenada Y final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
Llengua del Windows OCR N/A Xinès (simplificat), xinès (tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic), serbi (llatí), eslovac, castellà, suec, turc English L'idioma del text que detecta el motor OCR de Windows
Utilitza una altra llengua N/A Valor booleà Fals Especifica si s'ha d'utilitzar una llengua que no s'ha indicat al camp "Llengua del Tesseract"
Llengua del Tesseract N/A Anglès, Alemany, Castellà, Francès, Italià English Llengua del text que detecta el motor del Tesseract
Abreviatura de la llengua No Valor del text L'abreviatura de Tesseract de la llengua a utilitzar. Per exemple, si les dades són "eng.traineddata", definiu aquest paràmetre com a "eng"
Camí de les dades de llengua No Valor del text Camí de la carpeta que conté les dades del Tesseract de la llengua especificada
Multiplicador d'amplada de la imatge No Valor numèric 1 Multiplicador d'amplada de la imatge
Multiplicador d'alçada de la imatge No Valor numèric 1 Multiplicador d'alçada de la imatge
Algorisme de coincidència d'imatges N/A Bàsic, Avançat Bàsic Quin algorisme d'imatge s'ha d'utilitzar quan es busca imatge

Nota

  • Power AutomateEl motor d'expressió regular és .NET. Per trobar més informació sobre les expressions regulars, aneu a Llenguatge d'expressió regular - Referència ràpida.
  • L'opció de variable del motor OCR està prevista per a la deprecació.

Variables generades

Argument Type Descripció
UbicacióOfTextFoundX Valor numèric La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra
UbicacióOfTextFoundY Valor numèric La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra

Excepcions

Excepció Descripció
No es pot comprovar si el text existeix en mode no interactiu Indica que no és possible comprovar el text a la pantalla en mode no interactiu
Coordenades de subregió no vàlides Indica que les coordenades de subregió especificades no són vàlides
No s'ha pogut analitzar el text amb l'OCR Indica que s'ha produït un error en intentar analitzar el text amb l'OCR
No s'ha pogut crear el motor d'OCR Indica que s'ha produït un error en intentar crear el motor d'OCR
La carpeta del camí de dades no existeix Indica que la carpeta especificada per a les dades de llengua no existeix
El paquet de llengua del Windows seleccionat no està instal·lat a l'ordinador Indica que el paquet de llengua de Windows seleccionat no s'ha instal·lat a la màquina
El motor d'OCR no està actiu Indica que el motor d'OCR no està actiu

Espera el text a la pantalla (OCR)

Espereu fins que aparegui / desaparegui un text específic a la pantalla, a la finestra del primer pla o en relació amb una imatge de la pantalla o finestra del primer pla mitjançant OCR.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Espera que el text N/A Aparèixer, Desaparèixer Aparegui Especifica si s'ha d'esperar que el text aparegui o desaparegui
Tipus de motor d'OCR No Motor Windows OCR, motor Tesseract, motor OCR variable Variable del motor d'OCR El tipus de motor OCR a utilitzar. Seleccioneu un motor OCR preconfigurat o configureu-ne un de nou.
Variable del motor d'OCR No OCREngineObject Motor que s'ha d'utilitzar per a l'operació d'OCR
Text que cal cercar No Valor del text Text que s'ha de cercar a la font especificada
És una expressió regular N/A Valor booleà Fals Indica si s'ha d'utilitzar una expressió regular per trobar el text especificat
Cerca el text a N/A Pantalla sencera, finestra en primer pla Tota la pantalla Indica si voleu cercar el text especificat a tota la pantalla visible o només a la finestra de primer pla
Mode de cerca N/A Tota la font especificada, només subregió específica, subregió relativa a la imatge Tota la font especificada Especifica si s'ha d'escanejar tota la pantalla (o finestra) o una subregió reduïda d'aquesta
Imatges No Llista d'imatges Imatges que especifiquen la subregió (relativa a la cantonada superior esquerra de la imatge) que s'han d'escanejar per cercar el text proporcionat
X1 Valor numèric Coordenada X inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat
Tolerància Valor numèric 10 Especifica en quin grau poden diferir les imatges cercades de la imatge triada originalment
Y1 Valor numèric Coordenada Y inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat
X1 Valor numèric Coordenada X inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
X2 Valor numèric Coordenada X final de la subregió que s'ha d'escanejar per cercar el text proporcionat
Y1 Valor numèric Coordenada Y inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
Y2 Valor numèric Coordenada Y final de la subregió que s'ha d'escanejar per cercar el text proporcionat
X2 Valor numèric Coordenada X final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
Y2 Valor numèric Coordenada Y final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat
Llengua del Windows OCR N/A Xinès (simplificat), xinès (tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic), serbi (llatí), eslovac, castellà, suec, turc English L'idioma del text que detecta el motor OCR de Windows
Utilitza una altra llengua N/A Valor booleà Fals Especifica si s'ha d'utilitzar una llengua que no s'ha indicat al camp "Llengua del Tesseract"
Llengua del Tesseract N/A Anglès, Alemany, Castellà, Francès, Italià English Llengua del text que detecta el motor del Tesseract
Abreviatura de la llengua No Valor del text L'abreviatura de Tesseract de la llengua a utilitzar. Per exemple, si les dades són "eng.traineddata", definiu aquest paràmetre com a "eng"
Camí de les dades de llengua No Valor del text Camí de la carpeta que conté les dades del Tesseract de la llengua especificada
Multiplicador d'amplada de la imatge No Valor numèric 1 Multiplicador d'amplada de la imatge
Multiplicador d'alçada de la imatge No Valor numèric 1 Multiplicador d'alçada de la imatge
Algorisme de coincidència d'imatges N/A Bàsic, Avançat Bàsic Quin algorisme d'imatge s'ha d'utilitzar quan es busca imatge
Fallada amb error de temps d'espera N/A Valor booleà Fals Especifiqueu si voleu que l'acció esperi indefinidament o que falli després d'un període de temps definit

Nota

  • Power AutomateEl motor d'expressió regular és .NET. Per trobar més informació sobre les expressions regulars, aneu a Llenguatge d'expressió regular - Referència ràpida.
  • L'opció de variable del motor OCR està prevista per a la deprecació.

Variables generades

Argument Type Descripció
UbicacióOfTextFoundX Valor numèric La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra
UbicacióOfTextFoundY Valor numèric La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra

Excepcions

Excepció Descripció
No es pot comprovar si el text existeix en mode no interactiu Indica que no és possible comprovar el text a la pantalla en mode no interactiu
Coordenades de subregió no vàlides Indica que les coordenades de subregió especificades no són vàlides
No s'ha pogut analitzar el text amb l'OCR Indica que s'ha produït un error en intentar analitzar el text amb l'OCR
No s'ha pogut crear el motor d'OCR Indica que s'ha produït un error en intentar crear el motor d'OCR
La carpeta del camí de dades no existeix Indica que la carpeta especificada per a les dades de llengua no existeix
El paquet de llengua del Windows seleccionat no està instal·lat a l'ordinador Indica que el paquet de llengua de Windows seleccionat no s'ha instal·lat a la màquina
El motor d'OCR no està actiu Indica que el motor d'OCR no està actiu
Error de temps d'espera Indica que l'acció ha fallat després d'un període de temps determinat

Extreu el text amb l'OCR

Extraieu text d'una font determinada mitjançant el motor OCR donat.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Motor d'OCR No Motor Windows OCR, motor Tesseract, motor OCR variable Variable del motor d'OCR El tipus de motor OCR a utilitzar. Seleccioneu un motor OCR preconfigurat o configureu-ne un de nou
Variable del motor d'OCR No OCREngineObject Motor que s'ha d'utilitzar per a l'operació d'OCR
Origen d'OCR N/A Pantalla, finestra de primer pla, imatge al disc Pantalla Font de la imatge en què s'ha de realitzar l'operació d'OCR
Camí del fitxer d'imatge No Fitxer El camí de la imatge per realitzar l'operació OCR sobre
Mode de cerca N/A Tota la font especificada, només subregió específica, subregió relativa a la imatge Tota la font especificada Mode seleccionat per a l'operació d'OCR
Image No Llista d'imatges La imatge a utilitzar per reduir l'exploració a una subregió relativa a la imatge especificada
Tolerància Valor numèric 10 Especifica en quin grau pot diferir la imatge de la imatge triada originalment
X1 Valor numèric Coordenada X de l'inici de la subregió per refinar l'escaneig
X2 Valor numèric Coordenada X del final de la subregió per refinar l'escaneig
Y1 Valor numèric Coordenada Y de l'inici de la subregió per refinar l'escaneig
Y2 Valor numèric Coordenada Y del final de la subregió per refinar l'escaneig
Llengua del Windows OCR N/A Xinès (simplificat), xinès (tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic), serbi (llatí), eslovac, castellà, suec, turc English L'idioma del text que detecta el motor OCR de Windows
Utilitza una altra llengua N/A Valor booleà Fals Especifica si s'ha d'utilitzar una llengua que no s'ha indicat al camp "Llengua del Tesseract"
Llengua del Tesseract N/A Anglès, Alemany, Castellà, Francès, Italià English Llengua del text que detecta el motor del Tesseract
Abreviatura de la llengua No Valor del text L'abreviatura de Tesseract de la llengua a utilitzar. Per exemple, si les dades són "eng.traineddata", definiu aquest paràmetre com a "eng"
Camí de les dades de llengua No Valor del text Camí de la carpeta que conté les dades del Tesseract de la llengua especificada
Multiplicador d'amplada de la imatge No Valor numèric 1 Multiplicador d'amplada de la imatge
Multiplicador d'alçada de la imatge No Valor numèric 1 Multiplicador d'alçada de la imatge
Espera que la imatge aparegui N/A Valor booleà Cert Especifica si s'ha d'esperar o no que la imatge aparegui a la pantalla o a la finestra en primer pla
Temps d'espera No Valor numèric 5 Especifica el temps d'espera per completar l'operació abans que l'acció generi un error
Algorisme de coincidència d'imatges N/A Bàsic, Avançat Bàsic Quin algorisme d'imatge s'ha d'utilitzar quan es busca imatge

Nota

L'opció de variable del motor OCR està prevista per a la deprecació.

Variables generades

Argument Type Descripció
OcrText Valor del text El resultat després de l'extracció del text

Excepcions

Excepció Descripció
No s'ha pogut extreure el text amb l'OCR Indica que s'ha produït un error en intentar extreure el text amb l'OCR de la font proporcionada
No s'ha trobat el fitxer d'imatge Indica que el fitxer no existeix al camí indicat
No s'ha trobat la imatge de referència Indica que la imatge de referència no existeix
No es pot obtenir el text de la pantalla en mode no interactiu Indica que no és possible obtenir text de la pantalla en mode no interactiu
No s'ha pogut crear el motor d'OCR Indica que s'ha produït un error en intentar crear el motor d'OCR
La carpeta del camí de dades no existeix Indica que la carpeta especificada per a les dades de llengua no existeix
El paquet de llengua del Windows seleccionat no està instal·lat a l'ordinador Indica que el paquet de llengua de Windows seleccionat no s'ha instal·lat a la màquina
El motor d'OCR no està actiu Indica que el motor d'OCR no està actiu