Acțiuni OCR
Power Automate permite utilizatorilor să citească, să extragă și să gestioneze datele din fișiere prin recunoașterea optică a caracterelor (OCR).
Pentru a crea un motor OCR și a extrage text din imagini și documente, utilizați acțiunea Extrageți text cu OCR . Următorul exemplu extrage text din întreaga imagine specificată.
Toate acțiunile OCR pot crea o nouă variabilă de motor OCR sau pot folosi una existentă. Puteți utiliza variabilele motorului OCR existente în orice acțiune care oferă capabilități OCR.
Power Automate acceptă motoarele Windows OCR și Tesseract. Pentru a configura motorul OCR selectat, navigați la Setările motorului OCR acțiunii corespunzătoare. Opțiunile disponibile includ limba și multiplicatorii pentru lățimea și înălțimea imaginii.
Notă
- Toate motoarele OCR disponibile sunt preinstalate în Power Automate și funcționează local fără a se conecta la cloud. Cu toate acestea, poate fi necesar să descărcați pachete de limbi sau fișiere de date pentru a extrage texte în anumite limbi.
- Multiplicatorii de imagine măresc dimensiunea imaginii pentru a face căutarea și extragerea textului mai eficiente. Setarea unor valori mai mari de trei poate duce la rezultate eronate.
Utilizați motorul Windows OCR
Motorul OCR implicit din Power Automate este motorul OCR Windows. Pentru a extrage texte folosind motorul OCR Windows, trebuie să instalați pachetul de limbă adecvat pentru limba pe care doriți să o extrageți.
Dacă pachetul lingvistic corespunzător nu este instalat, Power Automate afișează o eroare, solicitându-vă să îl instalați. Pentru a găsi mai multe informații despre descărcarea și instalarea pachetelor de limbă, accesați Pachete de limbă pentru Windows.
După instalarea pachetului de limbi adecvat, extindeți setările motorului OCR ale acțiunii OCR și selectați limba dorită. Motorul Windows OCR acceptă 25 de limbi, inclusiv chineză (simplificată și tradițională), cehă, daneză, olandeză, engleză, finlandeză, franceză, germană, greacă, maghiară, italiană, japoneză, coreeană, norvegiană, poloneză, portugheză, română, rusă, Sârbă (chirilică și latină), slovacă, spaniolă, suedeză și turcă.
Utilizați motorul Tesseract OCR
Notă
Pentru a utiliza motorul Tesseract OCR, asigurați-vă că procesorul aparatului acceptă setul de instrucțiuni AVX2.
În afară de motorul Windows OCR, Power Automate accepta motorul Tesseract. Acest motor poate extrage text în cinci limbi fără alte configurații: engleză, germană, spaniolă, franceză și italiană.
Pentru a extrage text într-o limbă din afara listei menționate, activați opțiunea Utilizați alte limbi în Setări motor OCR a acțiunii OCR. Când această opțiune este activată, acțiunea afișează încă doi parametri: Abrevierea limbii și Calea datelor limbii.
Câmpul Abrevierea limbii indică motorului ce limbă să caute în timpul OCR. Câmpul Calea datelor de limbă conține fișierele de date de limbă (.traineddata) utilizate pentru a antrena motorul OCR. Puteți găsi fișierele de date privind limbile pentru toate limbile disponibile în acest depozit GitHub.
De asemenea, puteți utiliza motorul Tesseract pentru a extrage text din documente multilingve. Pentru a găsi mai multe informații despre extragerea textului din documente multilingve, accesați Efectuați OCR pe documente multilingve.
Dacă textul este pe ecran (OCR)
Marchează începutul unui bloc condiționat de acțiuni în funcție de dacă un anumit text apare sau nu pe ecran, folosind OCR.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Dacă textul | Nedisponibil | Există, nu există | Există | Specifică dacă se verifică dacă textul există pe sursa dată pentru analizat |
Tip de motor OCR | No | Motor OCR Windows, motor Tesseract, variabilă motor OCR | Variabilă motor OCR | Tipul de motor OCR de utilizat. Selectați un motor OCR preconfigurat sau configurați unul nou. |
Variabilă motor OCR | No | OCRengineObject | Motorul de utilizat pentru operația OCR | |
Textul de găsit | No | Valoare text | Textul de căutat în sursa specificată | |
Este o expresie regulată | Nedisponibil | Valoare booleană | Fals | Specifică dacă se utilizează o expresie regulată pentru a găsi textul specificat |
Căutați un text pe | Nedisponibil | Întregul ecran, fereastră din prim-plan | Ecran întreg | Specifică dacă se caută textul specificat pe întregul ecran vizibil sau doar în fereastra din prim-plan |
Modul de căutare | Nedisponibil | Întreaga sursă specificată, Numai subregiunea specifică, Subregiunea relativă la imagine | Întreaga sursă specificată | Specifică dacă se scanează întregul ecran (sau fereastră) sau o subregiune restrânsă a acestuia |
Imagini | No | Lista de Imagini | Imaginile care specifică subregiunea (în raport cu colțul din stânga sus al imaginii) de scanat pentru textul furnizat | |
X1 | Da | Valoare numerica | Coordonata X inițială a subregiunii de scanat pentru textul furnizat | |
Toleranță | Da | Valoare numerica | 10 | Specifică cât de mult pot diferi imaginile căutate față de imaginea aleasă inițial |
Y1 | Da | Valoare numerica | Coordonata Y inițială a subregiunii de scanat pentru textul furnizat | |
X1 | Da | Valoare numerica | Coordonata X inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
X2 | Da | Valoare numerica | Coordonata X finală a subregiunii de scanat pentru textul furnizat | |
Y1 | Da | Valoare numerica | Coordonata Y inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
Y2 | Da | Valoare numerica | Coordonata Y finală a subregiunii de scanat pentru textul furnizat | |
X2 | Da | Valoare numerica | Coordonata X finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
Y2 | Da | Valoare numerica | Coordonata Y finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
Limba Windows OCR | Nedisponibil | Chineză (simplificată), chineză (tradițională), cehă, daneză, engleză, finlandeză, franceză, germană, greacă, italiană, japoneză, maghiară, norvegiană, poloneză, portugheză, română, rusă, sârbă (chirilic), sârbă (latin), slovacă, spaniolă, suedeză, turcă | English | Limba textului detectat de motorul Windows OCR |
Folosiți altă limbă | Nedisponibil | Valoare booleană | Fals | Specifică dacă se folosește o limbă care nu este dată în câmpul „Limbă Tesseract” |
Limbă Tesseract | Nedisponibil | Engleză, germană, spaniolă, franceză, italiană | English | Limba textului detectată de motorul Tesseract |
Abrevierea limbii | No | Valoarea textului | Abrevierea Tesseract a limbii de utilizat. De exemplu, dacă datele sunt 'eng.traineddata', setați acest parametru la 'eng' | |
Calea datelor limbii | No | Valoarea textului | Calea folderului care conține datele Tesseract ale limbii specificate | |
Multiplicator de lățime al imaginii | No | Valoare numerică | 1 | Multiplicatorul de lățime al imaginii |
Multiplicator de înălțime al imaginii | No | Valoare numerică | 1 | Multiplicatorul de înălțime al imaginii |
Algoritm de potrivire a imaginilor | Nedisponibil | De bază, avansat | De bază | Ce algoritm de imagine să utilizați când căutați o imagine |
Notă
- Power AutomateMotorul de expresie regulată este .NET. Pentru a găsi mai multe informații despre expresiile regulate, accesați Limbajul expresiilor regulate - Referințe rapide.
- Opțiunea variabilă a motorului OCR este planificată pentru perimare.
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
LocationOfTextFoundX | Valoare numerică | Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei |
LocationOfTextFoundY | Valoare numerică | Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei |
Excepții
Excepție | Descriere |
---|---|
Nu poate verifica dacă există text în modul non-interactiv | Indică faptul că nu este posibil să verificați textul de pe ecran în modul non-interactiv |
Coordonatele subregiunii sunt nevalide | Indică faptul că nu sunt valide coordonatele de subregiune specificate |
Nu a reușit analizarea textului cu OCR | Indică o eroare apărută în timp ce se încearcă analizarea textului folosind OCR |
Nu a reușit crearea motorului OCR | Indică o eroare apărută în timp ce se încearcă crearea motorului OCR |
Calea folderului de date nu există | Indică faptul că folderul specificat pentru datele de limbă nu există |
Pachetul lingvistic Windows selectat nu este instalat pe computer | Indică faptul că pachetul lingvistic Windows selectat nu a fost instalat pe computer |
Motorul OCR nu este activ | Indică faptul că motorul OCR nu este activ |
Așteptare text de pe ecran (OCR)
Așteptați până când un anumit text apare / dispare pe ecran, pe fereastra din prim-plan sau relativ la o imagine de pe ecran sau fereastra din prim-plan folosind OCR.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Așteptați ca textul | Nedisponibil | Apariție, dispariție | Să apară | Specifică dacă trebuie să așteptați ca textul să apară sau să dispară |
Tip de motor OCR | No | Motor OCR Windows, motor Tesseract, variabilă motor OCR | Variabilă motor OCR | Tipul de motor OCR de utilizat. Selectați un motor OCR preconfigurat sau configurați unul nou. |
Variabilă motor OCR | No | OCREngineObject | Motorul de utilizat pentru operația OCR | |
Textul de găsit | No | Valoarea textului | Textul de căutat în sursa specificată | |
Este o expresie regulată | Nedisponibil | Valoarea booleană | Fals | Specifică dacă se utilizează o expresie regulată pentru a găsi textul specificat |
Căutați un text pe | Nedisponibil | Întregul ecran, fereastră din prim-plan | Ecran întreg | Specifică dacă se caută textul specificat pe întregul ecran vizibil sau doar în fereastra din prim-plan |
Modul de căutare | Nedisponibil | Întreaga sursă specificată, Numai subregiunea specifică, Subregiunea relativă la imagine | Întreaga sursă specificată | Specifică dacă se scanează întregul ecran (sau fereastră) sau o subregiune restrânsă a acestuia |
Imagini | No | Lista de Imagini | Imaginile care specifică subregiunea (în raport cu colțul din stânga sus al imaginii) de scanat pentru textul furnizat | |
X1 | Da | Valoare numerică | Coordonata X inițială a subregiunii de scanat pentru textul furnizat | |
Toleranță | Da | Valoare numerică | 10 | Specifică cât de mult pot diferi imaginile căutate față de imaginea aleasă inițial |
Y1 | Da | Valoare numerică | Coordonata Y inițială a subregiunii de scanat pentru textul furnizat | |
X1 | Da | Valoare numerică | Coordonata X inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
X2 | Da | Valoare numerică | Coordonata X finală a subregiunii de scanat pentru textul furnizat | |
Y1 | Da | Valoare numerică | Coordonata Y inițială a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
Y2 | Da | Valoare numerică | Coordonata Y finală a subregiunii de scanat pentru textul furnizat | |
X2 | Da | Valoare numerică | Coordonata X finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
Y2 | Da | Valoare numerică | Coordonata Y finală a subregiunii în raport cu imaginea specificată de scanat pentru textul furnizat | |
Limba Windows OCR | Nedisponibil | Chineză (simplificată), chineză (tradițională), cehă, daneză, engleză, finlandeză, franceză, germană, greacă, italiană, japoneză, maghiară, norvegiană, poloneză, portugheză, română, rusă, sârbă (chirilic), sârbă (latin), slovacă, spaniolă, suedeză, turcă | English | Limba textului detectat de motorul Windows OCR |
Folosiți altă limbă | Nedisponibil | Valoarea booleană | Fals | Specifică dacă se folosește o limbă care nu este dată în câmpul „Limbă Tesseract” |
Limbă Tesseract | Nedisponibil | Engleză, germană, spaniolă, franceză, italiană | English | Limba textului detectată de motorul Tesseract |
Abrevierea limbii | No | Valoarea textului | Abrevierea Tesseract a limbii de utilizat. De exemplu, dacă datele sunt 'eng.traineddata', setați acest parametru la 'eng' | |
Calea datelor limbii | No | Valoarea textului | Calea folderului care conține datele Tesseract ale limbii specificate | |
Multiplicator de lățime al imaginii | No | Valoare numerică | 1 | Multiplicatorul de lățime al imaginii |
Multiplicator de înălțime al imaginii | No | Valoare numerică | 1 | Multiplicatorul de înălțime al imaginii |
Algoritm de potrivire a imaginilor | Nedisponibil | De bază, avansat | De bază | Ce algoritm de imagine să utilizați când căutați o imagine |
Eșec cu eroare de expirare | Nedisponibil | Valoarea booleană | Fals | Specificați dacă doriți ca acțiunea să aștepte la nesfârșit sau să eșueze după o perioadă de timp stabilită |
Notă
- Power AutomateMotorul de expresie regulată este .NET. Pentru a găsi mai multe informații despre expresiile regulate, accesați Limbajul expresiilor regulate - Referințe rapide.
- Opțiunea variabilă a motorului OCR este planificată pentru perimare.
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
LocationOfTextFoundX | Valoare numerică | Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei |
LocationOfTextFoundY | Valoare numerică | Coordonata X a punctului în care apare textul pe ecran. În cazul în care căutarea este efectuată în fereastra din prim-plan, coordonata returnată este relativă în colțul din stânga sus al ferestrei |
Excepții
Excepție | Descriere |
---|---|
Nu poate verifica dacă există text în modul non-interactiv | Indică faptul că nu este posibil să verificați textul de pe ecran în modul non-interactiv |
Coordonatele subregiunii sunt nevalide | Indică faptul că nu sunt valide coordonatele de subregiune specificate |
Nu a reușit analizarea textului cu OCR | Indică o eroare apărută în timp ce se încearcă analizarea textului folosind OCR |
Nu a reușit crearea motorului OCR | Indică o eroare apărută în timp ce se încearcă crearea motorului OCR |
Calea folderului de date nu există | Indică faptul că folderul specificat pentru datele de limbă nu există |
Pachetul lingvistic Windows selectat nu este instalat pe computer | Indică faptul că pachetul lingvistic Windows selectat nu a fost instalat pe computer |
Motorul OCR nu este activ | Indică faptul că motorul OCR nu este activ |
Eroare de expirare | Indică faptul că acțiunea nu a reușit după o perioadă de timp stabilită |
Extrageți text cu OCR
Extrageți text dintr-o sursă dată utilizând motorul OCR dat.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Motor OCR | No | Motor OCR Windows, motor Tesseract, variabilă motor OCR | Variabilă motor OCR | Tipul de motor OCR de utilizat. Selectați un motor OCR preconfigurat sau configurați unul nou |
Variabilă motor OCR | No | OCREngineObject | Motorul de utilizat pentru operația OCR | |
Sursă OCR | Nedisponibil | Ecran, Fereastra din prim-plan, Imagine pe disc | Ecran | Sursa imaginii pe care se efectuează operația OCR |
Calea fișierului imagine | No | Fișier | Calea imaginii pentru a efectua operația OCR pe | |
Modul de căutare | Nedisponibil | Întreaga sursă specificată, Numai subregiunea specifică, Subregiunea relativă la imagine | Întreaga sursă specificată | Modul selectat pentru operația OCR |
Image | No | Lista de Imagini | Imaginea de utilizat pentru restrângerea scanării la o subregiune relativă la imaginea specificată | |
Toleranță | Da | Valoare numerică | 10 | Specifică cât de mult poate diferi imaginea față de imaginea aleasă inițial |
X1 | Da | Valoare numerică | Coordonata X inițială a subregiunii pentru a restrânge scanarea | |
X2 | Da | Valoare numerică | Coordonata X finală a subregiunii pentru a restrânge scanarea | |
Y1 | Da | Valoare numerică | Coordonata Y inițială a subregiunii pentru a restrânge scanarea | |
Y2 | Da | Valoare numerică | Coordonata Y finală a subregiunii pentru a restrânge scanarea | |
Limba Windows OCR | Nedisponibil | Chineză (simplificată), chineză (tradițională), cehă, daneză, engleză, finlandeză, franceză, germană, greacă, italiană, japoneză, maghiară, norvegiană, poloneză, portugheză, română, rusă, sârbă (chirilic), sârbă (latin), slovacă, spaniolă, suedeză, turcă | English | Limba textului detectat de motorul Windows OCR |
Folosiți altă limbă | Nedisponibil | Valoarea booleană | Fals | Specifică dacă se folosește o limbă care nu este dată în câmpul „Limbă Tesseract” |
Limbă Tesseract | Nedisponibil | Engleză, germană, spaniolă, franceză, italiană | English | Limba textului detectată de motorul Tesseract |
Abrevierea limbii | No | Valoarea textului | Abrevierea Tesseract a limbii de utilizat. De exemplu, dacă datele sunt 'eng.traineddata', setați acest parametru la 'eng' | |
Calea datelor limbii | No | Valoare text | Calea folderului care conține datele Tesseract ale limbii specificate | |
Multiplicator de lățime al imaginii | No | Valoare numerica | 1 | Multiplicatorul de lățime al imaginii |
Multiplicator de înălțime al imaginii | No | Valoare numerica | 1 | Multiplicatorul de înălțime al imaginii |
Așteptați să apară imaginea | Nedisponibil | Valoare booleană | Adevărat | Specifică dacă trebuie să așteptați ca imaginea să apară pe ecran sau în fereastra din prim-plan |
Perioadă de expirare | No | Valoare numerica | 5 | Specifică timpul de așteptare pentru finalizarea operației înainte ca acțiunea să eșueze |
Algoritm de potrivire a imaginilor | Nedisponibil | De bază, Avansat | De bază | Ce algoritm de imagine să utilizați când căutați o imagine |
Notă
Opțiunea variabilă a motorului OCR este planificată pentru perimare.
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
OcrText | Valoare text | Rezultatul după extragerea textului |
Excepții
Excepție | Descriere |
---|---|
Nu a reușit extragerea textului cu OCR | Indică o eroare apărută în timp ce se încearcă extragerea textului cu OCR din sursa dată |
Fișier imagine negăsit | Indică faptul că fișierul nu există la calea dată |
Imagine reper negăsită | Indică faptul că imaginea reper nu există |
Nu se poate prelua text de pe ecran în modul non-interactiv | Indică faptul că nu este posibil să preluați text de pe ecran în modul non-interactiv |
Nu a reușit crearea motorului OCR | Indică o eroare apărută în timp ce se încearcă crearea motorului OCR |
Calea folderului de date nu există | Indică faptul că folderul specificat pentru datele de limbă nu există |
Pachetul lingvistic Windows selectat nu este instalat pe computer | Indică faptul că pachetul lingvistic Windows selectat nu a fost instalat pe computer |
Motorul OCR nu este activ | Indică faptul că motorul OCR nu este activ |