Partajați prin


Acțiuni OCR

Power Automate permite utilizatorilor să citească, să extragă și să gestioneze datele din fișiere prin recunoașterea optică a caracterelor (OCR).

Pentru a crea un motor OCR și a extrage text din imagini și documente, utilizați acțiunea Extrageți text cu OCR . Următorul exemplu extrage text din întreaga imagine specificată.

Captură de ecran a acțiunii Extragere text cu OCR.

Toate acțiunile OCR pot crea o nouă variabilă de motor OCR sau pot folosi una existentă. Puteți utiliza variabilele motorului OCR existente în orice acțiune care oferă capabilități OCR.

Power Automate acceptă motoarele Windows OCR și Tesseract. Pentru a configura motorul OCR selectat, navigați la Setările motorului OCR acțiunii corespunzătoare. Opțiunile disponibile includ limba și multiplicatorii pentru lățimea și înălțimea imaginii.

Notă

  • Toate motoarele OCR disponibile sunt preinstalate în Power Automate și funcționează local fără a se conecta la cloud. Cu toate acestea, poate fi necesar să descărcați pachete de limbi sau fișiere de date pentru a extrage texte în anumite limbi.
  • Multiplicatorii de imagine măresc dimensiunea imaginii pentru a face căutarea și extragerea textului mai eficiente. Setarea unor valori mai mari de trei poate duce la rezultate eronate.

Utilizați motorul Windows OCR

Motorul OCR implicit din Power Automate este motorul OCR Windows. Pentru a extrage texte folosind motorul OCR Windows, trebuie să instalați pachetul de limbă adecvat pentru limba pe care doriți să o extrageți.

Dacă pachetul lingvistic corespunzător nu este instalat, Power Automate afișează o eroare, solicitându-vă să îl instalați. Pentru a găsi mai multe informații despre descărcarea și instalarea pachetelor de limbă, accesați Pachete de limbă pentru Windows.

După instalarea pachetului de limbi adecvat, extindeți setările motorului OCR ale acțiunii OCR și selectați limba dorită. Motorul Windows OCR acceptă 25 de limbi, inclusiv chineză (simplificată și tradițională), cehă, daneză, olandeză, engleză, finlandeză, franceză, germană, greacă, maghiară, italiană, japoneză, coreeană, norvegiană, poloneză, portugheză, română, rusă, Sârbă (chirilică și latină), slovacă, spaniolă, suedeză și turcă.

Utilizați motorul Tesseract OCR

Notă

Pentru a utiliza motorul Tesseract OCR, asigurați-vă că procesorul aparatului acceptă setul de instrucțiuni AVX2.

În afară de motorul Windows OCR, Power Automate accepta motorul Tesseract. Acest motor poate extrage text în cinci limbi fără alte configurații: engleză, germană, spaniolă, franceză și italiană.

Pentru a extrage text într-o limbă din afara listei menționate, activați opțiunea Utilizați alte limbi în Setări motor OCR a acțiunii OCR. Când această opțiune este activată, acțiunea afișează încă doi parametri: Abrevierea limbii și Calea datelor limbii.

Câmpul Abrevierea limbii indică motorului ce limbă să caute în timpul OCR. Câmpul Calea datelor de limbă conține fișierele de date de limbă (.traineddata) utilizate pentru a antrena motorul OCR. Puteți găsi fișierele de date privind limbile pentru toate limbile disponibile în acest depozit GitHub.

De asemenea, puteți utiliza motorul Tesseract pentru a extrage text din documente multilingve. Pentru a găsi mai multe informații despre extragerea textului din documente multilingve, accesați Efectuați OCR pe documente multilingve.

Dacă textul este pe ecran (OCR)

Marchează începutul unui bloc condiționat de acțiuni în funcție de dacă un anumit text apare sau nu pe ecran, folosind OCR.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Dacă textul Nedisponibil Există, nu există Există Specifică dacă se verifică dacă textul există pe sursa dată pentru analizat
Tip de motor OCR No Motor OCR Windows, motor Tesseract, variabilă motor OCR Variabilă motor OCR Tipul de motor OCR de utilizat. Selectați un motor OCR preconfigurat sau configurați unul nou.
Variabilă motor OCR No OCRengineObject Motorul de utilizat pentru operația OCR
Textul de găsit No Valoare text Textul de căutat în sursa specificată
Este o expresie regulată Nedisponibil Valoare booleană Fals Specifică dacă se utilizează o expresie regulată pentru a găsi textul specificat
Căutați un text pe Nedisponibil Întregul ecran, fereastră din prim-plan Ecran întreg Specifică dacă se caută textul specificat pe întregul ecran vizibil sau doar în fereastra din prim-plan
Modul de căutare Nedisponibil Întreaga sursă specificată, Numai subregiunea specifică, Subregiunea relativă la imagine Întreaga sursă specificată Specifică dacă se scanează întregul ecran (sau fereastră) sau o subregiune restrânsă a acestuia
Imagini No Lista de Imagini Imaginile care specifică subregiunea (în raport cu colțul din stânga sus al imaginii) de scanat pentru textul furnizat
X1 Da Valoare numerica Coordonata X inițială a subregiunii de scanat pentru textul furnizat
Toleranță Da Valoare numerica 10 Specifică cât de mult pot diferi imaginile căutate față de imaginea aleasă inițial
Y1 Da Valoare numerica Coordonata Y inițială a subregiunii de scanat pentru textul furnizat
X1 Da Valoare numerica Coordonata X inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
X2 Da Valoare numerica Coordonata X finală a subregiunii de scanat pentru textul furnizat
Y1 Da Valoare numerica Coordonata Y inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
Y2 Da Valoare numerica Coordonata Y finală a subregiunii de scanat pentru textul furnizat
X2 Da Valoare numerica Coordonata X finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
Y2 Da Valoare numerica Coordonata Y finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
Limba Windows OCR Nedisponibil Chineză (simplificată), chineză (tradițională), cehă, daneză, engleză, finlandeză, franceză, germană, greacă, italiană, japoneză, maghiară, norvegiană, poloneză, portugheză, română, rusă, sârbă (chirilic), sârbă (latin), slovacă, spaniolă, suedeză, turcă English Limba textului detectat de motorul Windows OCR
Folosiți altă limbă Nedisponibil Valoare booleană Fals Specifică dacă se folosește o limbă care nu este dată în câmpul „Limbă Tesseract”
Limbă Tesseract Nedisponibil Engleză, germană, spaniolă, franceză, italiană English Limba textului detectată de motorul Tesseract
Abrevierea limbii No Valoarea textului Abrevierea Tesseract a limbii de utilizat. De exemplu, dacă datele sunt 'eng.traineddata', setați acest parametru la 'eng'
Calea datelor limbii No Valoarea textului Calea folderului care conține datele Tesseract ale limbii specificate
Multiplicator de lățime al imaginii No Valoare numerică 1 Multiplicatorul de lățime al imaginii
Multiplicator de înălțime al imaginii No Valoare numerică 1 Multiplicatorul de înălțime al imaginii
Algoritm de potrivire a imaginilor Nedisponibil De bază, avansat De bază Ce algoritm de imagine să utilizați când căutați o imagine

Notă

  • Power AutomateMotorul de expresie regulată este .NET. Pentru a găsi mai multe informații despre expresiile regulate, accesați Limbajul expresiilor regulate - Referințe rapide.
  • Opțiunea variabilă a motorului OCR este planificată pentru perimare.

Variabile produse

Argument Tipul Descriere
LocationOfTextFoundX Valoare numerică Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei
LocationOfTextFoundY Valoare numerică Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei

Excepții

Excepție Descriere
Nu poate verifica dacă există text în modul non-interactiv Indică faptul că nu este posibil să verificați textul de pe ecran în modul non-interactiv
Coordonatele subregiunii sunt nevalide Indică faptul că nu sunt valide coordonatele de subregiune specificate
Nu a reușit analizarea textului cu OCR Indică o eroare apărută în timp ce se încearcă analizarea textului folosind OCR
Nu a reușit crearea motorului OCR Indică o eroare apărută în timp ce se încearcă crearea motorului OCR
Calea folderului de date nu există Indică faptul că folderul specificat pentru datele de limbă nu există
Pachetul lingvistic Windows selectat nu este instalat pe computer Indică faptul că pachetul lingvistic Windows selectat nu a fost instalat pe computer
Motorul OCR nu este activ Indică faptul că motorul OCR nu este activ

Așteptare text de pe ecran (OCR)

Așteptați până când un anumit text apare / dispare pe ecran, pe fereastra din prim-plan sau relativ la o imagine de pe ecran sau fereastra din prim-plan folosind OCR.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Așteptați ca textul Nedisponibil Apariție, dispariție Să apară Specifică dacă trebuie să așteptați ca textul să apară sau să dispară
Tip de motor OCR No Motor OCR Windows, motor Tesseract, variabilă motor OCR Variabilă motor OCR Tipul de motor OCR de utilizat. Selectați un motor OCR preconfigurat sau configurați unul nou.
Variabilă motor OCR No OCREngineObject Motorul de utilizat pentru operația OCR
Textul de găsit No Valoarea textului Textul de căutat în sursa specificată
Este o expresie regulată Nedisponibil Valoarea booleană Fals Specifică dacă se utilizează o expresie regulată pentru a găsi textul specificat
Căutați un text pe Nedisponibil Întregul ecran, fereastră din prim-plan Ecran întreg Specifică dacă se caută textul specificat pe întregul ecran vizibil sau doar în fereastra din prim-plan
Modul de căutare Nedisponibil Întreaga sursă specificată, Numai subregiunea specifică, Subregiunea relativă la imagine Întreaga sursă specificată Specifică dacă se scanează întregul ecran (sau fereastră) sau o subregiune restrânsă a acestuia
Imagini No Lista de Imagini Imaginile care specifică subregiunea (în raport cu colțul din stânga sus al imaginii) de scanat pentru textul furnizat
X1 Da Valoare numerică Coordonata X inițială a subregiunii de scanat pentru textul furnizat
Toleranță Da Valoare numerică 10 Specifică cât de mult pot diferi imaginile căutate față de imaginea aleasă inițial
Y1 Da Valoare numerică Coordonata Y inițială a subregiunii de scanat pentru textul furnizat
X1 Da Valoare numerică Coordonata X inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
X2 Da Valoare numerică Coordonata X finală a subregiunii de scanat pentru textul furnizat
Y1 Da Valoare numerică Coordonata Y inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
Y2 Da Valoare numerică Coordonata Y finală a subregiunii de scanat pentru textul furnizat
X2 Da Valoare numerică Coordonata X finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
Y2 Da Valoare numerică Coordonata Y finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat
Limba Windows OCR Nedisponibil Chineză (simplificată), chineză (tradițională), cehă, daneză, engleză, finlandeză, franceză, germană, greacă, italiană, japoneză, maghiară, norvegiană, poloneză, portugheză, română, rusă, sârbă (chirilic), sârbă (latin), slovacă, spaniolă, suedeză, turcă English Limba textului detectat de motorul Windows OCR
Folosiți altă limbă Nedisponibil Valoarea booleană Fals Specifică dacă se folosește o limbă care nu este dată în câmpul „Limbă Tesseract”
Limbă Tesseract Nedisponibil Engleză, germană, spaniolă, franceză, italiană English Limba textului detectată de motorul Tesseract
Abrevierea limbii No Valoarea textului Abrevierea Tesseract a limbii de utilizat. De exemplu, dacă datele sunt 'eng.traineddata', setați acest parametru la 'eng'
Calea datelor limbii No Valoarea textului Calea folderului care conține datele Tesseract ale limbii specificate
Multiplicator de lățime al imaginii No Valoare numerică 1 Multiplicatorul de lățime al imaginii
Multiplicator de înălțime al imaginii No Valoare numerică 1 Multiplicatorul de înălțime al imaginii
Algoritm de potrivire a imaginilor Nedisponibil De bază, avansat De bază Ce algoritm de imagine să utilizați când căutați o imagine
Eșec cu eroare de expirare Nedisponibil Valoarea booleană Fals Specificați dacă doriți ca acțiunea să aștepte la nesfârșit sau să eșueze după o perioadă de timp stabilită

Notă

  • Power AutomateMotorul de expresie regulată este .NET. Pentru a găsi mai multe informații despre expresiile regulate, accesați Limbajul expresiilor regulate - Referințe rapide.
  • Opțiunea variabilă a motorului OCR este planificată pentru perimare.

Variabile produse

Argument Tipul Descriere
LocationOfTextFoundX Valoare numerică Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei
LocationOfTextFoundY Valoare numerică Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei

Excepții

Excepție Descriere
Nu poate verifica dacă există text în modul non-interactiv Indică faptul că nu este posibil să verificați textul de pe ecran în modul non-interactiv
Coordonatele subregiunii sunt nevalide Indică faptul că nu sunt valide coordonatele de subregiune specificate
Nu a reușit analizarea textului cu OCR Indică o eroare apărută în timp ce se încearcă analizarea textului folosind OCR
Nu a reușit crearea motorului OCR Indică o eroare apărută în timp ce se încearcă crearea motorului OCR
Calea folderului de date nu există Indică faptul că folderul specificat pentru datele de limbă nu există
Pachetul lingvistic Windows selectat nu este instalat pe computer Indică faptul că pachetul lingvistic Windows selectat nu a fost instalat pe computer
Motorul OCR nu este activ Indică faptul că motorul OCR nu este activ
Eroare de expirare Indică faptul că acțiunea nu a reușit după o perioadă de timp stabilită

Extrageți text cu OCR

Extrageți text dintr-o sursă dată utilizând motorul OCR dat.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Motor OCR No Motor OCR Windows, motor Tesseract, variabilă motor OCR Variabilă motor OCR Tipul de motor OCR de utilizat. Selectați un motor OCR preconfigurat sau configurați unul nou
Variabilă motor OCR No OCREngineObject Motorul de utilizat pentru operația OCR
Sursă OCR Nedisponibil Ecran, Fereastra din prim-plan, Imagine pe disc Ecran Sursa imaginii pe care se efectuează operația OCR
Calea fișierului imagine No Fișier Calea imaginii pentru a efectua operația OCR pe
Modul de căutare Nedisponibil Întreaga sursă specificată, Numai subregiunea specifică, Subregiunea relativă la imagine Întreaga sursă specificată Modul selectat pentru operația OCR
Image No Lista de Imagini Imaginea de utilizat pentru restrângerea scanării la o subregiune relativă la imaginea specificată
Toleranță Da Valoare numerică 10 Specifică cât de mult poate diferi imaginea față de imaginea aleasă inițial
X1 Da Valoare numerică Coordonata X inițială a subregiunii pentru a restrânge scanarea
X2 Da Valoare numerică Coordonata X finală a subregiunii pentru a restrânge scanarea
Y1 Da Valoare numerică Coordonata Y inițială a subregiunii pentru a restrânge scanarea
Y2 Da Valoare numerică Coordonata Y finală a subregiunii pentru a restrânge scanarea
Limba Windows OCR Nedisponibil Chineză (simplificată), chineză (tradițională), cehă, daneză, engleză, finlandeză, franceză, germană, greacă, italiană, japoneză, maghiară, norvegiană, poloneză, portugheză, română, rusă, sârbă (chirilic), sârbă (latin), slovacă, spaniolă, suedeză, turcă English Limba textului detectat de motorul Windows OCR
Folosiți altă limbă Nedisponibil Valoarea booleană Fals Specifică dacă se folosește o limbă care nu este dată în câmpul „Limbă Tesseract”
Limbă Tesseract Nedisponibil Engleză, germană, spaniolă, franceză, italiană English Limba textului detectată de motorul Tesseract
Abrevierea limbii No Valoarea textului Abrevierea Tesseract a limbii de utilizat. De exemplu, dacă datele sunt 'eng.traineddata', setați acest parametru la 'eng'
Calea datelor limbii No Valoare text Calea folderului care conține datele Tesseract ale limbii specificate
Multiplicator de lățime al imaginii No Valoare numerica 1 Multiplicatorul de lățime al imaginii
Multiplicator de înălțime al imaginii No Valoare numerica 1 Multiplicatorul de înălțime al imaginii
Așteptați să apară imaginea Nedisponibil Valoare booleană Adevărat Specifică dacă trebuie să așteptați ca imaginea să apară pe ecran sau în fereastra din prim-plan
Perioadă de expirare No Valoare numerica 5 Specifică timpul de așteptare pentru finalizarea operației înainte ca acțiunea să eșueze
Algoritm de potrivire a imaginilor Nedisponibil De bază, Avansat De bază Ce algoritm de imagine să utilizați când căutați o imagine

Notă

Opțiunea variabilă a motorului OCR este planificată pentru perimare.

Variabile produse

Argument Tipul Descriere
OcrText Valoare text Rezultatul după extragerea textului

Excepții

Excepție Descriere
Nu a reușit extragerea textului cu OCR Indică o eroare apărută în timp ce se încearcă extragerea textului cu OCR din sursa dată
Fișier imagine negăsit Indică faptul că fișierul nu există la calea dată
Imagine reper negăsită Indică faptul că imaginea reper nu există
Nu se poate prelua text de pe ecran în modul non-interactiv Indică faptul că nu este posibil să preluați text de pe ecran în modul non-interactiv
Nu a reușit crearea motorului OCR Indică o eroare apărută în timp ce se încearcă crearea motorului OCR
Calea folderului de date nu există Indică faptul că folderul specificat pentru datele de limbă nu există
Pachetul lingvistic Windows selectat nu este instalat pe computer Indică faptul că pachetul lingvistic Windows selectat nu a fost instalat pe computer
Motorul OCR nu este activ Indică faptul că motorul OCR nu este activ