Zdieľať cez


Akcie OCR

Power Automate umožňuje používateľom čítať, extrahovať a spravovať údaje v súboroch prostredníctvom optického rozpoznávania znakov (OCR).

Ak chcete vytvoriť nástroj OCR a extrahovať text z obrázkov a dokumentov, použite akciu Extrahovať text pomocou OCR . Nasledujúci príklad extrahuje text z celého zadaného obrázka.

Snímka obrazovky s akciou Extrahovať text pomocou OCR.

Všetky akcie OCR môžu vytvoriť novú premennú nástroja OCR alebo použiť existujúcu. Existujúce premenné nástroja OCR môžete použiť v akejkoľvek akcii, ktorá ponúka možnosti OCR.

Power Automate podporuje motory Windows OCR a Tesseract. Ak chcete nakonfigurovať vybratý mechanizmus OCR, prejdite na Nastavenia mechanizmu OCR príslušnej akcie. Dostupné možnosti zahŕňajú jazyk a multiplikátory šírky a výšky obrázka.

Poznámka

  • Všetky dostupné nástroje OCR sú predinštalované v Power Automate a fungujú lokálne bez pripojenia ku cloudu. Na extrahovanie textov v konkrétnych jazykoch však možno budete musieť stiahnuť jazykové balíky alebo dátové súbory.
  • Násobiče obrázkov zväčšujú veľkosť obrázka, aby bolo vyhľadávanie a extrakcia textu efektívnejšie. Nastavenie hodnôt vyšších ako tri môže viesť k chybným výsledkom.

Použite nástroj Windows OCR

Predvolený nástroj OCR v Power Automate je nástroj OCR systému Windows. Ak chcete extrahovať texty pomocou nástroja Windows OCR, musíte nainštalovať príslušný jazykový balík pre jazyk, ktorý chcete extrahovať.

Ak príslušný jazykový balík nie je nainštalovaný, Power Automate zobrazí chybu a vyzve vás na jeho inštaláciu. Ak chcete nájsť ďalšie informácie o sťahovaní a inštalácii jazykových balíkov, prejdite na stránku Jazykové balíky pre Windows.

Po nainštalovaní príslušného jazykového balíka rozšírte nastavenia nástroja OCR akcie OCR a vyberte požadovaný jazyk. Modul Windows OCR podporuje 25 jazykov vrátane čínštiny (zjednodušenej a tradičnej), češtiny, dánčiny, holandčiny, angličtiny, fínčiny, francúzštiny, nemčiny, gréčtiny, maďarčiny, taliančiny, japončiny, kórejčiny, nórčiny, poľštiny, portugalčiny, rumunčiny, ruštiny, srbčina (cyrilika a latinka), slovenčina, španielčina, švédčina a turečtina.

Použite OCR engine Tesseract

Poznámka

Ak chcete použiť OCR engine Tesseract, uistite sa, že procesor počítača podporuje inštrukčnú sadu AVX2.

Okrem jadra Windows OCR Power Automate podporuje motor Tesseract. Tento nástroj dokáže extrahovať text v piatich jazykoch bez ďalšej konfigurácie: angličtina, nemčina, španielčina, francúzština a taliančina.

Ak chcete extrahovať text v jazyku mimo uvedeného zoznamu, povoľte možnosť Používať iné jazyky v Nastavenia nástroja OCR akcie OCR. Keď je táto možnosť povolená, akcia zobrazí dva ďalšie parametre: Skratka jazyka a Cesta k údajom jazyka.

Pole Skratka jazyka označuje nástroju, ktorý jazyk má počas OCR hľadať. Pole Jazyková dátová cesta obsahuje jazykové dátové súbory (.traineddata), ktoré sa používajú na trénovanie nástroja OCR. Jazykové dátové súbory pre všetky dostupné jazyky nájdete v tomto úložisku GitHub.

Na extrahovanie textu z viacjazyčných dokumentov môžete použiť aj nástroj Tesseract. Ak chcete nájsť ďalšie informácie o extrahovaní textu z viacjazyčných dokumentov, prejdite na Vykonanie OCR na viacjazyčných dokumentoch.

Ak je text na obrazovke (OCR)

Označí začiatok podmieneného bloku akcií v závislosti od toho, či sa daný text zobrazí na obrazovke alebo nie, pomocou OCR.

Vstupné parametre

Argument Voliteľné Akceptuje Predvolená hodnota Description
If text Nie je k dispozícii Existuje, Neexistuje Existuje Určuje, či sa má skontrolovať, či text existuje v danom zdroji, ktorý sa má analyzovať, alebo nie
OCR engine type No Windows OCR engine, Tesseract engine, OCR engine premenná OCR engine variable Použitý typ nástroja OCR. Vyberte vopred nakonfigurovaný nástroj OCR alebo nastavte nový nástroj.
OCR engine variable Nie OCREngineObject Nástroj, ktorý sa má použiť na operáciu nástroja OCR
Text to find Nie Textová hodnota Text, ktorý sa má vyhľadať v zadanom zdroji
Is regular expression Nie je k dispozícii Booleovská hodnota Nepravdivé Určuje, či sa má na vyhľadanie zadaného textu použiť regulárny výraz
Search for text on Nie je k dispozícii Celá obrazovka, Okno v popredí Celá obrazovka Určuje, či sa má zadaný text hľadať na celej viditeľnej obrazovke alebo len v okne v popredí
Search mode Neaplikovateľné Celý zadaný zdroj, Iba konkrétna podoblasť, Podoblasť vzhľadom na obrázok Celý zadaný zdroj Určuje, či sa má skenovať celá obrazovka (alebo okno) alebo jej zúžená podoblasť
Image(s) No Zoznam z snímky Obrázky určujúce podoblasť (vzhľadom na ľavý horný roh obrázka), v ktorej sa má skenovať zadaný text
X1 Áno Číselná hodnota Začiatočná súradnica X podoblasti, v ktorej sa má skenovať zadaný text
Tolerance Áno Číselná hodnota 10 Určuje, do akej miery sa môže hľadaný obrázok líšiť od pôvodne vybratého obrázka
Y1 Áno Číselná hodnota Začiatočná súradnica Y podoblasti, v ktorej sa má skenovať zadaný text
X1 Áno Číselná hodnota Začiatočná súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
X2 Áno Číselná hodnota Koncová súradnica X podoblasti, v ktorej sa má skenovať zadaný text
Y1 Áno Číselná hodnota Začiatočná súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
Y2 Áno Číselná hodnota Koncová súradnica Y podoblasti, v ktorej sa má skenovať zadaný text
X2 Áno Číselná hodnota Koncová súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
Y2 Áno Číselná hodnota Koncová súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
Jazyk nástroja Windows OCR Neaplikovateľné Čínština (zjednodušená), čínština (tradičná), čeština, dánčina, holandčina, angličtina, fínčina, francúzština, nemčina, gréčtina, maďarčina, taliančina, japončina, kórejčina, nórčina, poľština, portugalčina, rumunčina, ruština, srbčina (cyrilika), srbčina (latinka), slovenčina, španielčina, švédčina, turečtina angličtina Jazyk textu, ktorý rozpozná mechanizmus Windows OCR
Use other language Neaplikovateľné Booleovská hodnota Nepravdivé Určuje, či sa má použiť jazyk, ktorý nie je uvedený v poli Jazyk nástroja Tesseract
Tesseract language Neaplikovateľné Angličtina, nemčina, španielčina, francúzština, taliančina angličtina Jazyk textu, ktorý nástroj Tesseract zisťuje
Language abbreviation Nie Textová hodnota Skratka v Tesseracte skratka použitého jazyka. Ak sú napríklad údaje „eng.traineddata“, nastavte tento parameter na „eng“
Cesta k údajom jazyka No Textová hodnota Cesta k priečinku, v ktorom sa uchovávajú údaje nástroja Tesseract zadaného jazyka
Image width multiplier No Číselná hodnota 1 Násobiteľ šírky obrázka
Image height multiplier No Číselná hodnota 1 Násobiteľ výšky obrázka
Algoritmus porovnávania obrázkov Neaplikovateľné Základné, pokročilé Základná Ktorý obrázkový algoritmus použiť pri vyhľadávaní obrázka

Poznámka

  • Stroj regulárneho výrazu Power Automate je .NET. Ak chcete nájsť ďalšie informácie o regulárnych výrazoch, prejdite na Jazyk regulárnych výrazov – rýchly prehľad.
  • Možnosť OCR engine variable je plánovaná na ukončenie podpory.

Premenné sú vytvorené

Argument Type Description
LocationOfTextFoundX Číselná hodnota Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna
LocationOfTextFoundY Číselná hodnota Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna

Výnimky

Výnimka Description
V neinteraktívnom režime sa nedá skontrolovať, či text existuje Označuje, že v neinteraktívnom režime nie je možné skontrolovať text na obrazovke
Neplatné súradnice podoblasti Označuje, že zadané súradnice podoblasti sú neplatné
Nepodarilo sa analyzovať text pomocou nástroja OCR Označuje, že pri pokuse o analýzu textu pomocou nástroja OCR sa vyskytla chyba
Nepodarilo sa vytvoriť nástroj OCR Označuje, že pri pokuse o vytvorenie nástroja OCR sa vyskytla chyba
Priečinok na ceste k údajom neexistuje Označuje, že priečinok zadaný pre údaje jazyka neexistuje
Vybratý jazykový balík systému Windows nie je v počítači nainštalovaný Označuje, že vybratý jazykový balík Windows nebol nainštalovaný v počítači
Nástroj OCR nie je aktívny Označuje, že nástroj OCR nie je aktívny

Čakať na text na obrazovke (OCR)

Počkajte, kým sa na obrazovke, v okne v popredí alebo vo vzťahu k obrázku na obrazovke alebo v okne v popredí pomocou OCR nezobrazí/zmizne konkrétny text.

Vstupné parametre

Argument Voliteľné Akceptuje Predvolená hodnota Description
Wait for text to Nie je k dispozícii Zobraziť sa, Zmiznúť Zobraziť sa Určuje, či sa má čakať na zobrazenie alebo zmiznutie textu
OCR engine type No Windows OCR engine, Tesseract engine, OCR engine premenná OCR engine variable Použitý typ nástroja OCR. Vyberte vopred nakonfigurovaný nástroj OCR alebo nastavte nový nástroj.
OCR engine variable Nie OCREngineObject Nástroj, ktorý sa má použiť na operáciu nástroja OCR
Text to find Nie Textová hodnota Text, ktorý sa má vyhľadať v zadanom zdroji
Is regular expression Nie je k dispozícii Booleovská hodnota Nepravdivé Určuje, či sa má na vyhľadanie zadaného textu použiť regulárny výraz
Search for text on Nie je k dispozícii Celá obrazovka, Okno v popredí Celá obrazovka Určuje, či sa má zadaný text hľadať na celej viditeľnej obrazovke alebo len v okne v popredí
Search mode Neaplikovateľné Celý zadaný zdroj, Iba konkrétna podoblasť, Podoblasť vzhľadom na obrázok Celý zadaný zdroj Určuje, či sa má skenovať celá obrazovka (alebo okno) alebo jej zúžená podoblasť
Image(s) No Zoznam z snímky Obrázky určujúce podoblasť (vzhľadom na ľavý horný roh obrázka), v ktorej sa má skenovať zadaný text
X1 Áno Číselná hodnota Začiatočná súradnica X podoblasti, v ktorej sa má skenovať zadaný text
Tolerance Áno Číselná hodnota 10 Určuje, do akej miery sa môže hľadaný obrázok líšiť od pôvodne vybratého obrázka
Y1 Áno Číselná hodnota Začiatočná súradnica Y podoblasti, v ktorej sa má skenovať zadaný text
X1 Áno Číselná hodnota Začiatočná súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
X2 Áno Číselná hodnota Koncová súradnica X podoblasti, v ktorej sa má skenovať zadaný text
Y1 Áno Číselná hodnota Začiatočná súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
Y2 Áno Číselná hodnota Koncová súradnica Y podoblasti, v ktorej sa má skenovať zadaný text
X2 Áno Číselná hodnota Koncová súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
Y2 Áno Číselná hodnota Koncová súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text
Jazyk nástroja Windows OCR Neaplikovateľné Čínština (zjednodušená), čínština (tradičná), čeština, dánčina, holandčina, angličtina, fínčina, francúzština, nemčina, gréčtina, maďarčina, taliančina, japončina, kórejčina, nórčina, poľština, portugalčina, rumunčina, ruština, srbčina (cyrilika), srbčina (latinka), slovenčina, španielčina, švédčina, turečtina angličtina Jazyk textu, ktorý rozpozná mechanizmus Windows OCR
Use other language Neaplikovateľné Booleovská hodnota Nepravdivé Určuje, či sa má použiť jazyk, ktorý nie je uvedený v poli Jazyk nástroja Tesseract
Tesseract language Neaplikovateľné Angličtina, nemčina, španielčina, francúzština, taliančina angličtina Jazyk textu, ktorý nástroj Tesseract zisťuje
Language abbreviation Nie Textová hodnota Skratka v Tesseracte skratka použitého jazyka. Ak sú napríklad údaje „eng.traineddata“, nastavte tento parameter na „eng“
Cesta k údajom jazyka No Textová hodnota Cesta k priečinku, v ktorom sa uchovávajú údaje nástroja Tesseract zadaného jazyka
Image width multiplier No Číselná hodnota 1 Násobiteľ šírky obrázka
Image height multiplier No Číselná hodnota 1 Násobiteľ výšky obrázka
Algoritmus porovnávania obrázkov Neaplikovateľné Základné, pokročilé Základná Ktorý obrázkový algoritmus použiť pri vyhľadávaní obrázka
Zlyhať s chybou uplynutia časového limitu Neaplikovateľné Booleovská hodnota Nepravdivé Zadajte, či chcete, aby akcia čakala nekonečne dlho alebo aby zlyhala po stanovenom časovom období

Poznámka

  • Stroj regulárneho výrazu Power Automate je .NET. Ak chcete nájsť ďalšie informácie o regulárnych výrazoch, prejdite na Jazyk regulárnych výrazov – rýchly prehľad.
  • Možnosť OCR engine variable je plánovaná na ukončenie podpory.

Premenné sú vytvorené

Argument Type Description
LocationOfTextFoundX Číselná hodnota Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna
LocationOfTextFoundY Číselná hodnota Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna

Výnimky

Výnimka Description
V neinteraktívnom režime sa nedá skontrolovať, či text existuje Označuje, že v neinteraktívnom režime nie je možné skontrolovať text na obrazovke
Neplatné súradnice podoblasti Označuje, že zadané súradnice podoblasti sú neplatné
Nepodarilo sa analyzovať text pomocou nástroja OCR Označuje, že pri pokuse o analýzu textu pomocou nástroja OCR sa vyskytla chyba
Nepodarilo sa vytvoriť nástroj OCR Označuje, že pri pokuse o vytvorenie nástroja OCR sa vyskytla chyba
Priečinok na ceste k údajom neexistuje Označuje, že priečinok zadaný pre údaje jazyka neexistuje
Vybratý jazykový balík systému Windows nie je v počítači nainštalovaný Označuje, že vybratý jazykový balík Windows nebol nainštalovaný v počítači
Nástroj OCR nie je aktívny Označuje, že nástroj OCR nie je aktívny
Chyba uplynutia časového limitu Označuje, že akcia zlyhala po nastavenom časovom období

Extrahovať text pomocou nástroja OCR

Extrahujte text z daného zdroja pomocou daného nástroja OCR.

Vstupné parametre

Argument Voliteľné Akceptuje Predvolená hodnota Description
OCR engine No Windows OCR engine, Tesseract engine, OCR engine premenná OCR engine variable Použitý typ nástroja OCR. Vyberte vopred nakonfigurovaný modul OCR alebo nastavte nový
OCR engine variable No OCREngineObject Nástroj, ktorý sa má použiť na operáciu nástroja OCR
OCR source Nie je k dispozícii Obrazovka, Okno v popredí, Obrázok na disku Obrazovka Zdroj obrázka, v ktorom sa má uskutočniť operácia nástroja OCR
Image file path Nie Súbor Cesta obrázka, v ktorom sa má uskutočniť operácia nástroja OCR
Search mode Nie je k dispozícii Celý zadaný zdroj, Iba konkrétna podoblasť, Podoblasť vzhľadom na obrázok Celý zadaný zdroj Vybratý režim pre operáciu nástroja OCR
Image No Zoznam z snímky Obrázok, ktorý sa má použiť na zúženie skenovania na podoblasť vzhľadom na zadaný obrázok
Tolerance Áno Číselná hodnota 10 Určuje, do akej miery sa môže obrázok líšiť od pôvodne vybratého obrázka
X1 Áno Číselná hodnota Začiatočná súradnica X podoblasti, v ktorej sa má zúžiť skenovanie
X2 Áno Číselná hodnota Koncová súradnica X podoblasti, v ktorej sa má zúžiť skenovanie
Y1 Áno Číselná hodnota Začiatočná súradnica Y podoblasti, v ktorej sa má zúžiť skenovanie
Y2 Áno Číselná hodnota Koncová súradnica Y podoblasti, v ktorej sa má zúžiť skenovanie
Jazyk nástroja Windows OCR Neaplikovateľné Čínština (zjednodušená), čínština (tradičná), čeština, dánčina, holandčina, angličtina, fínčina, francúzština, nemčina, gréčtina, maďarčina, taliančina, japončina, kórejčina, nórčina, poľština, portugalčina, rumunčina, ruština, srbčina (cyrilika), srbčina (latinka), slovenčina, španielčina, švédčina, turečtina angličtina Jazyk textu, ktorý rozpozná mechanizmus Windows OCR
Use other language Neaplikovateľné Booleovská hodnota Nepravdivé Určuje, či sa má použiť jazyk, ktorý nie je uvedený v poli Jazyk nástroja Tesseract
Tesseract language Neaplikovateľné Angličtina, nemčina, španielčina, francúzština, taliančina angličtina Jazyk textu, ktorý nástroj Tesseract zisťuje
Language abbreviation Nie Textová hodnota Skratka v Tesseracte skratka použitého jazyka. Ak sú napríklad údaje „eng.traineddata“, nastavte tento parameter na „eng“
Cesta k údajom jazyka No Textová hodnota Cesta k priečinku, v ktorom sa uchovávajú údaje nástroja Tesseract zadaného jazyka
Image width multiplier No Číselná hodnota 1 Násobiteľ šírky obrázka
Image height multiplier No Číselná hodnota 1 Násobiteľ výšky obrázka
Wait for image to appear Neaplikovateľné Booleovská hodnota Pravdivé Určuje, či sa má čakať na zobrazenie obrázka na obrazovke alebo v okne v popredí alebo nie
Timeout No Číselná hodnota 5 Určuje čas čakania na dokončenie operácie, skôr než daná akcia zlyhá
Algoritmus porovnávania obrázkov Neaplikovateľné Základné, pokročilé Základná Ktorý obrázkový algoritmus použiť pri vyhľadávaní obrázka

Poznámka

Možnosť OCR engine variable je plánovaná na ukončenie podpory.

Premenné sú vytvorené

Argument Type Description
OcrText Textová hodnota Výsledok po extrakcii textu

Výnimky

Výnimka Popis
Nepodarilo sa extrahovať text pomocou nástroja OCR Označuje, že pri pokuse o extrahovanie textu pomocou nástroja OCR z daného zdroja sa vyskytla chyba
Súbor s obrázkom sa nenašiel Označuje, že súbor neexistuje na danej ceste
Obrázok orientačných bodov sa nenašiel Označuje, že obrázok orientačných bodov neexistuje
V neinteraktívnom režime sa nedá získať text z obrazovky Označuje, že v neinteraktívnom režime nie je možné získať text z obrazovky
Nepodarilo sa vytvoriť nástroj OCR Označuje, že pri pokuse o vytvorenie nástroja OCR sa vyskytla chyba
Priečinok na ceste k údajom neexistuje Označuje, že priečinok zadaný pre údaje jazyka neexistuje
Vybratý jazykový balík systému Windows nie je v počítači nainštalovaný Označuje, že vybratý jazykový balík Windows nebol nainštalovaný v počítači
Nástroj OCR nie je aktívny Označuje, že nástroj OCR nie je aktívny