Accions de la OCR
Power Automate permet als usuaris llegir, extreure i gestionar dades dins dels fitxers mitjançant el reconeixement òptic de caràcters (OCR).
Per crear un motor OCR i extreure text d'imatges i documents, utilitzeu l'acció Extreu text amb OCR . L'exemple següent extreu text de tota la imatge especificada.
Totes les accions OCR poden crear una nova variable de motor OCR o utilitzar-ne una d'existent. Podeu utilitzar variables de motor OCR existents en qualsevol acció que ofereixi capacitats OCR.
Power Automate admet els motors OCR i Tesseract de Windows. Per configurar el motor OCR seleccionat, aneu a la configuració del motor OCR de l'acció adequada. Les opcions disponibles inclouen l'idioma i els multiplicadors d'amplada i alçada de la imatge.
Nota
- Tots els motors OCR disponibles estan preinstal·lats i funcionen Power Automate localment sense connectar-se al núvol. Tanmateix, és possible que hàgiu de descarregar paquets de llengua o fitxers de dades per extreure textos en idiomes específics.
- Els multiplicadors d'imatges augmenten la mida de la imatge per fer que la cerca i l'extracció de text siguin més efectives. Establir valors superiors a tres pot conduir a resultats erronis.
Utilitzeu el motor OCR de Windows
El motor OCR predeterminat és Power Automate el motor OCR de Windows. Per extreure textos mitjançant el motor OCR de Windows, heu d'instal·lar el paquet de llengua adequat per a l'idioma que voleu extreure.
Si el paquet de llengua apropiat no està instal·lat, llança un error, Power Automate demanant-li que l'instal·li. Per trobar més informació sobre la descàrrega i instal·lació de paquets de llengua, aneu a Paquets de llengua per a Windows.
Després d'instal·lar el paquet de llengua adequat, amplieu la configuració del motor OCR de l'acció OCR i seleccioneu l'idioma que vulgueu. El motor OCR de Windows admet 25 idiomes, inclosos el xinès (simplificat i tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic i llatí), eslovac, espanyol, suec i turc.
Utilitzeu el motor OCR Tesseract
Nota
Per fer ús del motor OCR Tesseract, assegureu-vos que la CPU de la màquina admeti el conjunt d'instruccions AVX2.
A part del motor OCR de Windows, Power Automate suporta el motor Tesseract. Aquest motor pot extreure text en cinc idiomes sense més configuració: anglès, alemany, espanyol, francès i italià.
Per extreure text en un idioma fora de la llista esmentada, activeu l'opció Utilitza altres idiomes a la configuració del motor OCR de l'acció OCR. Quan aquesta opció està habilitada, l'acció mostra dos paràmetres més: Abreviatura d'idioma i Ruta de dades de llengua.
El camp Abreviatura d'idioma indica al motor quin idioma ha de buscar durant OCR. El camp Camí d'accés de dades d'idioma conté els fitxers de dades d'idioma (.traineddata) utilitzats per entrenar el motor OCR. Podeu trobar els fitxers de dades d'idioma per a tots els idiomes disponibles en aquest repositori de GitHub.
També podeu utilitzar el motor Tesseract per extreure text de documents multilingües. Per obtenir més informació sobre l'extracció de text de documents multilingües, aneu a Realitzar OCR en documents multilingües.
Si el text de la pantalla (OCR)
Marca l'inici d'un bloc condicional d'accions en funció de si un determinat text apareix a la pantalla o no, mitjançant OCR.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Si el text | N/A | Existeix, No existeix | Existeix | Especifica si s'ha de comprovar si el text existeix o no a la font indicada per analitzar |
Tipus de motor d'OCR | No | Motor Windows OCR, motor Tesseract, motor OCR variable | Variable del motor d'OCR | El tipus de motor OCR a utilitzar. Seleccioneu un motor OCR preconfigurat o configureu-ne un de nou. |
Variable del motor d'OCR | No | OCREngineObject | Motor que s'ha d'utilitzar per a l'operació d'OCR | |
Text que cal cercar | No | Valor del text | Text que s'ha de cercar a la font especificada | |
És una expressió regular | N/A | Valor booleà | Fals | Indica si s'ha d'utilitzar una expressió regular per trobar el text especificat |
Cerca el text a | N/A | Pantalla sencera, finestra en primer pla | Tota la pantalla | Indica si voleu cercar el text especificat a tota la pantalla visible o només a la finestra de primer pla |
Mode de cerca | N/A | Tota la font especificada, només subregió específica, subregió relativa a la imatge | Tota la font especificada | Especifica si s'ha d'escanejar tota la pantalla (o finestra) o una subregió reduïda d'aquesta |
Imatges | No | Llista d'imatges | Imatges que especifiquen la subregió (relativa a la cantonada superior esquerra de la imatge) que s'han d'escanejar per cercar el text proporcionat | |
X1 | Sí | Valor numèric | Coordenada X inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
Tolerància | Sí | Valor numèric | 10 | Especifica en quin grau poden diferir les imatges cercades de la imatge triada originalment |
Y1 | Sí | Valor numèric | Coordenada Y inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
X1 | Sí | Valor numèric | Coordenada X inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
X2 | Sí | Valor numèric | Coordenada X final de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
Y1 | Sí | Valor numèric | Coordenada Y inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
Y2 | Sí | Valor numèric | Coordenada Y final de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
X2 | Sí | Valor numèric | Coordenada X final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
Y2 | Sí | Valor numèric | Coordenada Y final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
Llengua del Windows OCR | N/A | Xinès (simplificat), xinès (tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic), serbi (llatí), eslovac, castellà, suec, turc | English | L'idioma del text que detecta el motor OCR de Windows |
Utilitza una altra llengua | N/A | Valor booleà | Fals | Especifica si s'ha d'utilitzar una llengua que no s'ha indicat al camp "Llengua del Tesseract" |
Llengua del Tesseract | N/A | Anglès, Alemany, Castellà, Francès, Italià | English | Llengua del text que detecta el motor del Tesseract |
Abreviatura de la llengua | No | Valor del text | L'abreviatura de Tesseract de la llengua a utilitzar. Per exemple, si les dades són "eng.traineddata", definiu aquest paràmetre com a "eng" | |
Camí de les dades de llengua | No | Valor del text | Camí de la carpeta que conté les dades del Tesseract de la llengua especificada | |
Multiplicador d'amplada de la imatge | No | Valor numèric | 1 | Multiplicador d'amplada de la imatge |
Multiplicador d'alçada de la imatge | No | Valor numèric | 1 | Multiplicador d'alçada de la imatge |
Algorisme de coincidència d'imatges | N/A | Bàsic, Avançat | Bàsic | Quin algorisme d'imatge s'ha d'utilitzar quan es busca imatge |
Nota
- Power AutomateEl motor d'expressió regular és .NET. Per trobar més informació sobre les expressions regulars, aneu a Llenguatge d'expressió regular - Referència ràpida.
- L'opció de variable del motor OCR està prevista per a la deprecació.
Variables generades
Argument | Type | Descripció |
---|---|---|
UbicacióOfTextFoundX | Valor numèric | La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra |
UbicacióOfTextFoundY | Valor numèric | La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra |
Excepcions
Excepció | Descripció |
---|---|
No es pot comprovar si el text existeix en mode no interactiu | Indica que no és possible comprovar el text a la pantalla en mode no interactiu |
Coordenades de subregió no vàlides | Indica que les coordenades de subregió especificades no són vàlides |
No s'ha pogut analitzar el text amb l'OCR | Indica que s'ha produït un error en intentar analitzar el text amb l'OCR |
No s'ha pogut crear el motor d'OCR | Indica que s'ha produït un error en intentar crear el motor d'OCR |
La carpeta del camí de dades no existeix | Indica que la carpeta especificada per a les dades de llengua no existeix |
El paquet de llengua del Windows seleccionat no està instal·lat a l'ordinador | Indica que el paquet de llengua de Windows seleccionat no s'ha instal·lat a la màquina |
El motor d'OCR no està actiu | Indica que el motor d'OCR no està actiu |
Espera el text a la pantalla (OCR)
Espereu fins que aparegui / desaparegui un text específic a la pantalla, a la finestra del primer pla o en relació amb una imatge de la pantalla o finestra del primer pla mitjançant OCR.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Espera que el text | N/A | Aparèixer, Desaparèixer | Aparegui | Especifica si s'ha d'esperar que el text aparegui o desaparegui |
Tipus de motor d'OCR | No | Motor Windows OCR, motor Tesseract, motor OCR variable | Variable del motor d'OCR | El tipus de motor OCR a utilitzar. Seleccioneu un motor OCR preconfigurat o configureu-ne un de nou. |
Variable del motor d'OCR | No | OCREngineObject | Motor que s'ha d'utilitzar per a l'operació d'OCR | |
Text que cal cercar | No | Valor del text | Text que s'ha de cercar a la font especificada | |
És una expressió regular | N/A | Valor booleà | Fals | Indica si s'ha d'utilitzar una expressió regular per trobar el text especificat |
Cerca el text a | N/A | Pantalla sencera, finestra en primer pla | Tota la pantalla | Indica si voleu cercar el text especificat a tota la pantalla visible o només a la finestra de primer pla |
Mode de cerca | N/A | Tota la font especificada, només subregió específica, subregió relativa a la imatge | Tota la font especificada | Especifica si s'ha d'escanejar tota la pantalla (o finestra) o una subregió reduïda d'aquesta |
Imatges | No | Llista d'imatges | Imatges que especifiquen la subregió (relativa a la cantonada superior esquerra de la imatge) que s'han d'escanejar per cercar el text proporcionat | |
X1 | Sí | Valor numèric | Coordenada X inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
Tolerància | Sí | Valor numèric | 10 | Especifica en quin grau poden diferir les imatges cercades de la imatge triada originalment |
Y1 | Sí | Valor numèric | Coordenada Y inicial de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
X1 | Sí | Valor numèric | Coordenada X inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
X2 | Sí | Valor numèric | Coordenada X final de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
Y1 | Sí | Valor numèric | Coordenada Y inicial de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
Y2 | Sí | Valor numèric | Coordenada Y final de la subregió que s'ha d'escanejar per cercar el text proporcionat | |
X2 | Sí | Valor numèric | Coordenada X final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
Y2 | Sí | Valor numèric | Coordenada Y final de la subregió relativa a la imatge especificada que s'ha d'escanejar per cercar el text proporcionat | |
Llengua del Windows OCR | N/A | Xinès (simplificat), xinès (tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic), serbi (llatí), eslovac, castellà, suec, turc | English | L'idioma del text que detecta el motor OCR de Windows |
Utilitza una altra llengua | N/A | Valor booleà | Fals | Especifica si s'ha d'utilitzar una llengua que no s'ha indicat al camp "Llengua del Tesseract" |
Llengua del Tesseract | N/A | Anglès, Alemany, Castellà, Francès, Italià | English | Llengua del text que detecta el motor del Tesseract |
Abreviatura de la llengua | No | Valor del text | L'abreviatura de Tesseract de la llengua a utilitzar. Per exemple, si les dades són "eng.traineddata", definiu aquest paràmetre com a "eng" | |
Camí de les dades de llengua | No | Valor del text | Camí de la carpeta que conté les dades del Tesseract de la llengua especificada | |
Multiplicador d'amplada de la imatge | No | Valor numèric | 1 | Multiplicador d'amplada de la imatge |
Multiplicador d'alçada de la imatge | No | Valor numèric | 1 | Multiplicador d'alçada de la imatge |
Algorisme de coincidència d'imatges | N/A | Bàsic, Avançat | Bàsic | Quin algorisme d'imatge s'ha d'utilitzar quan es busca imatge |
Fallada amb error de temps d'espera | N/A | Valor booleà | Fals | Especifiqueu si voleu que l'acció esperi indefinidament o que falli després d'un període de temps definit |
Nota
- Power AutomateEl motor d'expressió regular és .NET. Per trobar més informació sobre les expressions regulars, aneu a Llenguatge d'expressió regular - Referència ràpida.
- L'opció de variable del motor OCR està prevista per a la deprecació.
Variables generades
Argument | Type | Descripció |
---|---|---|
UbicacióOfTextFoundX | Valor numèric | La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra |
UbicacióOfTextFoundY | Valor numèric | La coordenada X del punt on apareix el text a la pantalla. Si la cerca es realitza a la finestra del primer pla, la coordenada retornada és relativa a la cantonada superior esquerra de la finestra |
Excepcions
Excepció | Descripció |
---|---|
No es pot comprovar si el text existeix en mode no interactiu | Indica que no és possible comprovar el text a la pantalla en mode no interactiu |
Coordenades de subregió no vàlides | Indica que les coordenades de subregió especificades no són vàlides |
No s'ha pogut analitzar el text amb l'OCR | Indica que s'ha produït un error en intentar analitzar el text amb l'OCR |
No s'ha pogut crear el motor d'OCR | Indica que s'ha produït un error en intentar crear el motor d'OCR |
La carpeta del camí de dades no existeix | Indica que la carpeta especificada per a les dades de llengua no existeix |
El paquet de llengua del Windows seleccionat no està instal·lat a l'ordinador | Indica que el paquet de llengua de Windows seleccionat no s'ha instal·lat a la màquina |
El motor d'OCR no està actiu | Indica que el motor d'OCR no està actiu |
Error de temps d'espera | Indica que l'acció ha fallat després d'un període de temps determinat |
Extreu el text amb l'OCR
Extraieu text d'una font determinada mitjançant el motor OCR donat.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Motor d'OCR | No | Motor Windows OCR, motor Tesseract, motor OCR variable | Variable del motor d'OCR | El tipus de motor OCR a utilitzar. Seleccioneu un motor OCR preconfigurat o configureu-ne un de nou |
Variable del motor d'OCR | No | OCREngineObject | Motor que s'ha d'utilitzar per a l'operació d'OCR | |
Origen d'OCR | N/A | Pantalla, finestra de primer pla, imatge al disc | Pantalla | Font de la imatge en què s'ha de realitzar l'operació d'OCR |
Camí del fitxer d'imatge | No | Fitxer | El camí de la imatge per realitzar l'operació OCR sobre | |
Mode de cerca | N/A | Tota la font especificada, només subregió específica, subregió relativa a la imatge | Tota la font especificada | Mode seleccionat per a l'operació d'OCR |
Image | No | Llista d'imatges | La imatge a utilitzar per reduir l'exploració a una subregió relativa a la imatge especificada | |
Tolerància | Sí | Valor numèric | 10 | Especifica en quin grau pot diferir la imatge de la imatge triada originalment |
X1 | Sí | Valor numèric | Coordenada X de l'inici de la subregió per refinar l'escaneig | |
X2 | Sí | Valor numèric | Coordenada X del final de la subregió per refinar l'escaneig | |
Y1 | Sí | Valor numèric | Coordenada Y de l'inici de la subregió per refinar l'escaneig | |
Y2 | Sí | Valor numèric | Coordenada Y del final de la subregió per refinar l'escaneig | |
Llengua del Windows OCR | N/A | Xinès (simplificat), xinès (tradicional), txec, danès, holandès, anglès, finès, francès, alemany, grec, hongarès, italià, japonès, coreà, noruec, polonès, portuguès, romanès, rus, serbi (ciríl·lic), serbi (llatí), eslovac, castellà, suec, turc | English | L'idioma del text que detecta el motor OCR de Windows |
Utilitza una altra llengua | N/A | Valor booleà | Fals | Especifica si s'ha d'utilitzar una llengua que no s'ha indicat al camp "Llengua del Tesseract" |
Llengua del Tesseract | N/A | Anglès, Alemany, Castellà, Francès, Italià | English | Llengua del text que detecta el motor del Tesseract |
Abreviatura de la llengua | No | Valor del text | L'abreviatura de Tesseract de la llengua a utilitzar. Per exemple, si les dades són "eng.traineddata", definiu aquest paràmetre com a "eng" | |
Camí de les dades de llengua | No | Valor del text | Camí de la carpeta que conté les dades del Tesseract de la llengua especificada | |
Multiplicador d'amplada de la imatge | No | Valor numèric | 1 | Multiplicador d'amplada de la imatge |
Multiplicador d'alçada de la imatge | No | Valor numèric | 1 | Multiplicador d'alçada de la imatge |
Espera que la imatge aparegui | N/A | Valor booleà | Cert | Especifica si s'ha d'esperar o no que la imatge aparegui a la pantalla o a la finestra en primer pla |
Temps d'espera | No | Valor numèric | 5 | Especifica el temps d'espera per completar l'operació abans que l'acció generi un error |
Algorisme de coincidència d'imatges | N/A | Bàsic, Avançat | Bàsic | Quin algorisme d'imatge s'ha d'utilitzar quan es busca imatge |
Nota
L'opció de variable del motor OCR està prevista per a la deprecació.
Variables generades
Argument | Type | Descripció |
---|---|---|
OcrText | Valor del text | El resultat després de l'extracció del text |
Excepcions
Excepció | Descripció |
---|---|
No s'ha pogut extreure el text amb l'OCR | Indica que s'ha produït un error en intentar extreure el text amb l'OCR de la font proporcionada |
No s'ha trobat el fitxer d'imatge | Indica que el fitxer no existeix al camí indicat |
No s'ha trobat la imatge de referència | Indica que la imatge de referència no existeix |
No es pot obtenir el text de la pantalla en mode no interactiu | Indica que no és possible obtenir text de la pantalla en mode no interactiu |
No s'ha pogut crear el motor d'OCR | Indica que s'ha produït un error en intentar crear el motor d'OCR |
La carpeta del camí de dades no existeix | Indica que la carpeta especificada per a les dades de llengua no existeix |
El paquet de llengua del Windows seleccionat no està instal·lat a l'ordinador | Indica que el paquet de llengua de Windows seleccionat no s'ha instal·lat a la màquina |
El motor d'OCR no està actiu | Indica que el motor d'OCR no està actiu |