Akcie OCR
Power Automate umožňuje používateľom čítať, extrahovať a spravovať údaje v súboroch prostredníctvom optického rozpoznávania znakov (OCR).
Ak chcete vytvoriť nástroj OCR a extrahovať text z obrázkov a dokumentov, použite akciu Extrahovať text pomocou OCR . Nasledujúci príklad extrahuje text z celého zadaného obrázka.
Všetky akcie OCR môžu vytvoriť novú premennú nástroja OCR alebo použiť existujúcu. Existujúce premenné nástroja OCR môžete použiť v akejkoľvek akcii, ktorá ponúka možnosti OCR.
Power Automate podporuje motory Windows OCR a Tesseract. Ak chcete nakonfigurovať vybratý mechanizmus OCR, prejdite na Nastavenia mechanizmu OCR príslušnej akcie. Dostupné možnosti zahŕňajú jazyk a multiplikátory šírky a výšky obrázka.
Poznámka
- Všetky dostupné nástroje OCR sú predinštalované v Power Automate a fungujú lokálne bez pripojenia ku cloudu. Na extrahovanie textov v konkrétnych jazykoch však možno budete musieť stiahnuť jazykové balíky alebo dátové súbory.
- Násobiče obrázkov zväčšujú veľkosť obrázka, aby bolo vyhľadávanie a extrakcia textu efektívnejšie. Nastavenie hodnôt vyšších ako tri môže viesť k chybným výsledkom.
Použite nástroj Windows OCR
Predvolený nástroj OCR v Power Automate je nástroj OCR systému Windows. Ak chcete extrahovať texty pomocou nástroja Windows OCR, musíte nainštalovať príslušný jazykový balík pre jazyk, ktorý chcete extrahovať.
Ak príslušný jazykový balík nie je nainštalovaný, Power Automate zobrazí chybu a vyzve vás na jeho inštaláciu. Ak chcete nájsť ďalšie informácie o sťahovaní a inštalácii jazykových balíkov, prejdite na stránku Jazykové balíky pre Windows.
Po nainštalovaní príslušného jazykového balíka rozšírte nastavenia nástroja OCR akcie OCR a vyberte požadovaný jazyk. Modul Windows OCR podporuje 25 jazykov vrátane čínštiny (zjednodušenej a tradičnej), češtiny, dánčiny, holandčiny, angličtiny, fínčiny, francúzštiny, nemčiny, gréčtiny, maďarčiny, taliančiny, japončiny, kórejčiny, nórčiny, poľštiny, portugalčiny, rumunčiny, ruštiny, srbčina (cyrilika a latinka), slovenčina, španielčina, švédčina a turečtina.
Použite OCR engine Tesseract
Poznámka
Ak chcete použiť OCR engine Tesseract, uistite sa, že procesor počítača podporuje inštrukčnú sadu AVX2.
Okrem jadra Windows OCR Power Automate podporuje motor Tesseract. Tento nástroj dokáže extrahovať text v piatich jazykoch bez ďalšej konfigurácie: angličtina, nemčina, španielčina, francúzština a taliančina.
Ak chcete extrahovať text v jazyku mimo uvedeného zoznamu, povoľte možnosť Používať iné jazyky v Nastavenia nástroja OCR akcie OCR. Keď je táto možnosť povolená, akcia zobrazí dva ďalšie parametre: Skratka jazyka a Cesta k údajom jazyka.
Pole Skratka jazyka označuje nástroju, ktorý jazyk má počas OCR hľadať. Pole Jazyková dátová cesta obsahuje jazykové dátové súbory (.traineddata), ktoré sa používajú na trénovanie nástroja OCR. Jazykové dátové súbory pre všetky dostupné jazyky nájdete v tomto úložisku GitHub.
Na extrahovanie textu z viacjazyčných dokumentov môžete použiť aj nástroj Tesseract. Ak chcete nájsť ďalšie informácie o extrahovaní textu z viacjazyčných dokumentov, prejdite na Vykonanie OCR na viacjazyčných dokumentoch.
Ak je text na obrazovke (OCR)
Označí začiatok podmieneného bloku akcií v závislosti od toho, či sa daný text zobrazí na obrazovke alebo nie, pomocou OCR.
Vstupné parametre
Argument | Voliteľné | Akceptuje | Predvolená hodnota | Description |
---|---|---|---|---|
If text | Nie je k dispozícii | Existuje, Neexistuje | Existuje | Určuje, či sa má skontrolovať, či text existuje v danom zdroji, ktorý sa má analyzovať, alebo nie |
OCR engine type | No | Windows OCR engine, Tesseract engine, OCR engine premenná | OCR engine variable | Použitý typ nástroja OCR. Vyberte vopred nakonfigurovaný nástroj OCR alebo nastavte nový nástroj. |
OCR engine variable | Nie | OCREngineObject | Nástroj, ktorý sa má použiť na operáciu nástroja OCR | |
Text to find | Nie | Textová hodnota | Text, ktorý sa má vyhľadať v zadanom zdroji | |
Is regular expression | Nie je k dispozícii | Booleovská hodnota | Nepravdivé | Určuje, či sa má na vyhľadanie zadaného textu použiť regulárny výraz |
Search for text on | Nie je k dispozícii | Celá obrazovka, Okno v popredí | Celá obrazovka | Určuje, či sa má zadaný text hľadať na celej viditeľnej obrazovke alebo len v okne v popredí |
Search mode | Neaplikovateľné | Celý zadaný zdroj, Iba konkrétna podoblasť, Podoblasť vzhľadom na obrázok | Celý zadaný zdroj | Určuje, či sa má skenovať celá obrazovka (alebo okno) alebo jej zúžená podoblasť |
Image(s) | No | Zoznam z snímky | Obrázky určujúce podoblasť (vzhľadom na ľavý horný roh obrázka), v ktorej sa má skenovať zadaný text | |
X1 | Áno | Číselná hodnota | Začiatočná súradnica X podoblasti, v ktorej sa má skenovať zadaný text | |
Tolerance | Áno | Číselná hodnota | 10 | Určuje, do akej miery sa môže hľadaný obrázok líšiť od pôvodne vybratého obrázka |
Y1 | Áno | Číselná hodnota | Začiatočná súradnica Y podoblasti, v ktorej sa má skenovať zadaný text | |
X1 | Áno | Číselná hodnota | Začiatočná súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
X2 | Áno | Číselná hodnota | Koncová súradnica X podoblasti, v ktorej sa má skenovať zadaný text | |
Y1 | Áno | Číselná hodnota | Začiatočná súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
Y2 | Áno | Číselná hodnota | Koncová súradnica Y podoblasti, v ktorej sa má skenovať zadaný text | |
X2 | Áno | Číselná hodnota | Koncová súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
Y2 | Áno | Číselná hodnota | Koncová súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
Jazyk nástroja Windows OCR | Neaplikovateľné | Čínština (zjednodušená), čínština (tradičná), čeština, dánčina, holandčina, angličtina, fínčina, francúzština, nemčina, gréčtina, maďarčina, taliančina, japončina, kórejčina, nórčina, poľština, portugalčina, rumunčina, ruština, srbčina (cyrilika), srbčina (latinka), slovenčina, španielčina, švédčina, turečtina | angličtina | Jazyk textu, ktorý rozpozná mechanizmus Windows OCR |
Use other language | Neaplikovateľné | Booleovská hodnota | Nepravdivé | Určuje, či sa má použiť jazyk, ktorý nie je uvedený v poli Jazyk nástroja Tesseract |
Tesseract language | Neaplikovateľné | Angličtina, nemčina, španielčina, francúzština, taliančina | angličtina | Jazyk textu, ktorý nástroj Tesseract zisťuje |
Language abbreviation | Nie | Textová hodnota | Skratka v Tesseracte skratka použitého jazyka. Ak sú napríklad údaje „eng.traineddata“, nastavte tento parameter na „eng“ | |
Cesta k údajom jazyka | No | Textová hodnota | Cesta k priečinku, v ktorom sa uchovávajú údaje nástroja Tesseract zadaného jazyka | |
Image width multiplier | No | Číselná hodnota | 1 | Násobiteľ šírky obrázka |
Image height multiplier | No | Číselná hodnota | 1 | Násobiteľ výšky obrázka |
Algoritmus porovnávania obrázkov | Neaplikovateľné | Základné, pokročilé | Základná | Ktorý obrázkový algoritmus použiť pri vyhľadávaní obrázka |
Poznámka
- Stroj regulárneho výrazu Power Automate je .NET. Ak chcete nájsť ďalšie informácie o regulárnych výrazoch, prejdite na Jazyk regulárnych výrazov – rýchly prehľad.
- Možnosť OCR engine variable je plánovaná na ukončenie podpory.
Premenné sú vytvorené
Argument | Type | Description |
---|---|---|
LocationOfTextFoundX | Číselná hodnota | Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna |
LocationOfTextFoundY | Číselná hodnota | Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna |
Výnimky
Výnimka | Description |
---|---|
V neinteraktívnom režime sa nedá skontrolovať, či text existuje | Označuje, že v neinteraktívnom režime nie je možné skontrolovať text na obrazovke |
Neplatné súradnice podoblasti | Označuje, že zadané súradnice podoblasti sú neplatné |
Nepodarilo sa analyzovať text pomocou nástroja OCR | Označuje, že pri pokuse o analýzu textu pomocou nástroja OCR sa vyskytla chyba |
Nepodarilo sa vytvoriť nástroj OCR | Označuje, že pri pokuse o vytvorenie nástroja OCR sa vyskytla chyba |
Priečinok na ceste k údajom neexistuje | Označuje, že priečinok zadaný pre údaje jazyka neexistuje |
Vybratý jazykový balík systému Windows nie je v počítači nainštalovaný | Označuje, že vybratý jazykový balík Windows nebol nainštalovaný v počítači |
Nástroj OCR nie je aktívny | Označuje, že nástroj OCR nie je aktívny |
Čakať na text na obrazovke (OCR)
Počkajte, kým sa na obrazovke, v okne v popredí alebo vo vzťahu k obrázku na obrazovke alebo v okne v popredí pomocou OCR nezobrazí/zmizne konkrétny text.
Vstupné parametre
Argument | Voliteľné | Akceptuje | Predvolená hodnota | Description |
---|---|---|---|---|
Wait for text to | Nie je k dispozícii | Zobraziť sa, Zmiznúť | Zobraziť sa | Určuje, či sa má čakať na zobrazenie alebo zmiznutie textu |
OCR engine type | No | Windows OCR engine, Tesseract engine, OCR engine premenná | OCR engine variable | Použitý typ nástroja OCR. Vyberte vopred nakonfigurovaný nástroj OCR alebo nastavte nový nástroj. |
OCR engine variable | Nie | OCREngineObject | Nástroj, ktorý sa má použiť na operáciu nástroja OCR | |
Text to find | Nie | Textová hodnota | Text, ktorý sa má vyhľadať v zadanom zdroji | |
Is regular expression | Nie je k dispozícii | Booleovská hodnota | Nepravdivé | Určuje, či sa má na vyhľadanie zadaného textu použiť regulárny výraz |
Search for text on | Nie je k dispozícii | Celá obrazovka, Okno v popredí | Celá obrazovka | Určuje, či sa má zadaný text hľadať na celej viditeľnej obrazovke alebo len v okne v popredí |
Search mode | Neaplikovateľné | Celý zadaný zdroj, Iba konkrétna podoblasť, Podoblasť vzhľadom na obrázok | Celý zadaný zdroj | Určuje, či sa má skenovať celá obrazovka (alebo okno) alebo jej zúžená podoblasť |
Image(s) | No | Zoznam z snímky | Obrázky určujúce podoblasť (vzhľadom na ľavý horný roh obrázka), v ktorej sa má skenovať zadaný text | |
X1 | Áno | Číselná hodnota | Začiatočná súradnica X podoblasti, v ktorej sa má skenovať zadaný text | |
Tolerance | Áno | Číselná hodnota | 10 | Určuje, do akej miery sa môže hľadaný obrázok líšiť od pôvodne vybratého obrázka |
Y1 | Áno | Číselná hodnota | Začiatočná súradnica Y podoblasti, v ktorej sa má skenovať zadaný text | |
X1 | Áno | Číselná hodnota | Začiatočná súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
X2 | Áno | Číselná hodnota | Koncová súradnica X podoblasti, v ktorej sa má skenovať zadaný text | |
Y1 | Áno | Číselná hodnota | Začiatočná súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
Y2 | Áno | Číselná hodnota | Koncová súradnica Y podoblasti, v ktorej sa má skenovať zadaný text | |
X2 | Áno | Číselná hodnota | Koncová súradnica X podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
Y2 | Áno | Číselná hodnota | Koncová súradnica Y podoblasti vzhľadom na zadaný obrázok, v ktorej sa má skenovať zadaný text | |
Jazyk nástroja Windows OCR | Neaplikovateľné | Čínština (zjednodušená), čínština (tradičná), čeština, dánčina, holandčina, angličtina, fínčina, francúzština, nemčina, gréčtina, maďarčina, taliančina, japončina, kórejčina, nórčina, poľština, portugalčina, rumunčina, ruština, srbčina (cyrilika), srbčina (latinka), slovenčina, španielčina, švédčina, turečtina | angličtina | Jazyk textu, ktorý rozpozná mechanizmus Windows OCR |
Use other language | Neaplikovateľné | Booleovská hodnota | Nepravdivé | Určuje, či sa má použiť jazyk, ktorý nie je uvedený v poli Jazyk nástroja Tesseract |
Tesseract language | Neaplikovateľné | Angličtina, nemčina, španielčina, francúzština, taliančina | angličtina | Jazyk textu, ktorý nástroj Tesseract zisťuje |
Language abbreviation | Nie | Textová hodnota | Skratka v Tesseracte skratka použitého jazyka. Ak sú napríklad údaje „eng.traineddata“, nastavte tento parameter na „eng“ | |
Cesta k údajom jazyka | No | Textová hodnota | Cesta k priečinku, v ktorom sa uchovávajú údaje nástroja Tesseract zadaného jazyka | |
Image width multiplier | No | Číselná hodnota | 1 | Násobiteľ šírky obrázka |
Image height multiplier | No | Číselná hodnota | 1 | Násobiteľ výšky obrázka |
Algoritmus porovnávania obrázkov | Neaplikovateľné | Základné, pokročilé | Základná | Ktorý obrázkový algoritmus použiť pri vyhľadávaní obrázka |
Zlyhať s chybou uplynutia časového limitu | Neaplikovateľné | Booleovská hodnota | Nepravdivé | Zadajte, či chcete, aby akcia čakala nekonečne dlho alebo aby zlyhala po stanovenom časovom období |
Poznámka
- Stroj regulárneho výrazu Power Automate je .NET. Ak chcete nájsť ďalšie informácie o regulárnych výrazoch, prejdite na Jazyk regulárnych výrazov – rýchly prehľad.
- Možnosť OCR engine variable je plánovaná na ukončenie podpory.
Premenné sú vytvorené
Argument | Type | Description |
---|---|---|
LocationOfTextFoundX | Číselná hodnota | Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna |
LocationOfTextFoundY | Číselná hodnota | Súradnica X bodu, v ktorom sa zobrazí na obrazovke. Ak sa vyhľadávanie prebehne v okne v popredí, vrátená súradnica je relatívna k ľavému hornému rohu okna |
Výnimky
Výnimka | Description |
---|---|
V neinteraktívnom režime sa nedá skontrolovať, či text existuje | Označuje, že v neinteraktívnom režime nie je možné skontrolovať text na obrazovke |
Neplatné súradnice podoblasti | Označuje, že zadané súradnice podoblasti sú neplatné |
Nepodarilo sa analyzovať text pomocou nástroja OCR | Označuje, že pri pokuse o analýzu textu pomocou nástroja OCR sa vyskytla chyba |
Nepodarilo sa vytvoriť nástroj OCR | Označuje, že pri pokuse o vytvorenie nástroja OCR sa vyskytla chyba |
Priečinok na ceste k údajom neexistuje | Označuje, že priečinok zadaný pre údaje jazyka neexistuje |
Vybratý jazykový balík systému Windows nie je v počítači nainštalovaný | Označuje, že vybratý jazykový balík Windows nebol nainštalovaný v počítači |
Nástroj OCR nie je aktívny | Označuje, že nástroj OCR nie je aktívny |
Chyba uplynutia časového limitu | Označuje, že akcia zlyhala po nastavenom časovom období |
Extrahovať text pomocou nástroja OCR
Extrahujte text z daného zdroja pomocou daného nástroja OCR.
Vstupné parametre
Argument | Voliteľné | Akceptuje | Predvolená hodnota | Description |
---|---|---|---|---|
OCR engine | No | Windows OCR engine, Tesseract engine, OCR engine premenná | OCR engine variable | Použitý typ nástroja OCR. Vyberte vopred nakonfigurovaný modul OCR alebo nastavte nový |
OCR engine variable | No | OCREngineObject | Nástroj, ktorý sa má použiť na operáciu nástroja OCR | |
OCR source | Nie je k dispozícii | Obrazovka, Okno v popredí, Obrázok na disku | Obrazovka | Zdroj obrázka, v ktorom sa má uskutočniť operácia nástroja OCR |
Image file path | Nie | Súbor | Cesta obrázka, v ktorom sa má uskutočniť operácia nástroja OCR | |
Search mode | Nie je k dispozícii | Celý zadaný zdroj, Iba konkrétna podoblasť, Podoblasť vzhľadom na obrázok | Celý zadaný zdroj | Vybratý režim pre operáciu nástroja OCR |
Image | No | Zoznam z snímky | Obrázok, ktorý sa má použiť na zúženie skenovania na podoblasť vzhľadom na zadaný obrázok | |
Tolerance | Áno | Číselná hodnota | 10 | Určuje, do akej miery sa môže obrázok líšiť od pôvodne vybratého obrázka |
X1 | Áno | Číselná hodnota | Začiatočná súradnica X podoblasti, v ktorej sa má zúžiť skenovanie | |
X2 | Áno | Číselná hodnota | Koncová súradnica X podoblasti, v ktorej sa má zúžiť skenovanie | |
Y1 | Áno | Číselná hodnota | Začiatočná súradnica Y podoblasti, v ktorej sa má zúžiť skenovanie | |
Y2 | Áno | Číselná hodnota | Koncová súradnica Y podoblasti, v ktorej sa má zúžiť skenovanie | |
Jazyk nástroja Windows OCR | Neaplikovateľné | Čínština (zjednodušená), čínština (tradičná), čeština, dánčina, holandčina, angličtina, fínčina, francúzština, nemčina, gréčtina, maďarčina, taliančina, japončina, kórejčina, nórčina, poľština, portugalčina, rumunčina, ruština, srbčina (cyrilika), srbčina (latinka), slovenčina, španielčina, švédčina, turečtina | angličtina | Jazyk textu, ktorý rozpozná mechanizmus Windows OCR |
Use other language | Neaplikovateľné | Booleovská hodnota | Nepravdivé | Určuje, či sa má použiť jazyk, ktorý nie je uvedený v poli Jazyk nástroja Tesseract |
Tesseract language | Neaplikovateľné | Angličtina, nemčina, španielčina, francúzština, taliančina | angličtina | Jazyk textu, ktorý nástroj Tesseract zisťuje |
Language abbreviation | Nie | Textová hodnota | Skratka v Tesseracte skratka použitého jazyka. Ak sú napríklad údaje „eng.traineddata“, nastavte tento parameter na „eng“ | |
Cesta k údajom jazyka | No | Textová hodnota | Cesta k priečinku, v ktorom sa uchovávajú údaje nástroja Tesseract zadaného jazyka | |
Image width multiplier | No | Číselná hodnota | 1 | Násobiteľ šírky obrázka |
Image height multiplier | No | Číselná hodnota | 1 | Násobiteľ výšky obrázka |
Wait for image to appear | Neaplikovateľné | Booleovská hodnota | Pravdivé | Určuje, či sa má čakať na zobrazenie obrázka na obrazovke alebo v okne v popredí alebo nie |
Timeout | No | Číselná hodnota | 5 | Určuje čas čakania na dokončenie operácie, skôr než daná akcia zlyhá |
Algoritmus porovnávania obrázkov | Neaplikovateľné | Základné, pokročilé | Základná | Ktorý obrázkový algoritmus použiť pri vyhľadávaní obrázka |
Poznámka
Možnosť OCR engine variable je plánovaná na ukončenie podpory.
Premenné sú vytvorené
Argument | Type | Description |
---|---|---|
OcrText | Textová hodnota | Výsledok po extrakcii textu |
Výnimky
Výnimka | Popis |
---|---|
Nepodarilo sa extrahovať text pomocou nástroja OCR | Označuje, že pri pokuse o extrahovanie textu pomocou nástroja OCR z daného zdroja sa vyskytla chyba |
Súbor s obrázkom sa nenašiel | Označuje, že súbor neexistuje na danej ceste |
Obrázok orientačných bodov sa nenašiel | Označuje, že obrázok orientačných bodov neexistuje |
V neinteraktívnom režime sa nedá získať text z obrazovky | Označuje, že v neinteraktívnom režime nie je možné získať text z obrazovky |
Nepodarilo sa vytvoriť nástroj OCR | Označuje, že pri pokuse o vytvorenie nástroja OCR sa vyskytla chyba |
Priečinok na ceste k údajom neexistuje | Označuje, že priečinok zadaný pre údaje jazyka neexistuje |
Vybratý jazykový balík systému Windows nie je v počítači nainštalovaný | Označuje, že vybratý jazykový balík Windows nebol nainštalovaný v počítači |
Nástroj OCR nie je aktívny | Označuje, že nástroj OCR nie je aktívny |