Дії OCR

Стаття
11/08/2023

Power Automate дозволяє користувачам читати, витягувати та керувати даними у файлах за допомогою оптичного розпізнавання символів (OCR).

Щоб створити механізм оптичного розпізнавання символів і витягти текст із зображень і документів, скористайтеся дією Витягти текст за допомогою оптичного розпізнавання символів. У наведеному нижче прикладі витягується текст з усього вказаного зображення.

Скріншот дії Витягти текст за допомогою оптичного розпізнавання тексту.

Усі дії OCR можуть створювати нову змінну механізму оптичного розпізнавання символів або використовувати існуючу. Ви можете використовувати наявні змінні механізму оптичного розпізнавання символів у будь-якій дії, яка пропонує можливості оптичного розпізнавання символів.

Power Automate підтримує движки Windows OCR і Tesseract. Щоб налаштувати вибраний механізм оптичного розпізнавання символів, перейдіть до налаштувань механізму оптичного розпізнавання символів відповідної дії. Доступні параметри включають мову та множники ширини та висоти зображення.

Нотатка

Усі доступні механізми оптичного розпізнавання символів попередньо встановлені Power Automate та працюють локально без підключення до хмари. Однак вам може знадобитися завантажити мовні пакети або файли даних, щоб витягти тексти певними мовами.
Множники зображень збільшують розмір зображення, щоб зробити пошук і вилучення тексту більш ефективними. Встановлення значень, більших за три, може призвести до помилкових результатів.

Використання механізму оптичного розпізнавання символів Windows

Типовим обробником оптичного розпізнавання символів є Power Automate рушій оптичного розпізнавання символів Windows. Щоб витягти тексти за допомогою механізму оптичного розпізнавання символів Windows, необхідно інсталювати відповідний мовний пакет для мови, яку потрібно витягти.

Якщо відповідний мовний пакет не встановлений,видає Power Automate помилку з пропозицією встановити його. Щоб дізнатися більше про завантаження та інсталяцію мовних пакетів, перейдіть до розділу Мовні пакети для Windows.

Після інсталяції відповідного мовного пакета розширте налаштування механізму оптичного розпізнавання символів дії OCR і виберіть потрібну мову. Процесор оптичного розпізнавання символів Windows підтримує 25 мов, зокрема китайську (спрощену та традиційну), чеську, данську, голландську, англійську, фінську, французьку, німецьку, грецьку, угорську, італійську, японську, корейську, норвезьку, польську, португальську, румунську, російську, сербську (кирилицю та латиницю), словацьку, іспанську, шведську та турецьку.

Використовуйте механізм оптичного розпізнавання символів Tesseract

Нотатка

Щоб використовувати механізм оптичного розпізнавання символів Tesseract, переконайтеся, що центральний процесор апарата підтримує набір інструкцій AVX2.

Крім движка оптичного розпізнавання тексту для Windows,підтримує Power Automate движок Tesseract. Цей движок може витягувати текст п’ятьма мовами без подальшого налаштування: англійською, німецькою, іспанською, французькою та італійською.

Щоб витягти текст мовою, що не входить до згаданого списку, увімкніть параметр Використовувати інші мови в налаштуваннях механізму оптичного розпізнавання символів дії OCR. Коли ця опція увімкнена, дія відображає ще два параметри: Абревіатура мови та Шлях даних мови.

Поле «Абревіатура мови» вказує рушію, яку мову слід шукати під час оптичного розпізнавання символів. Поле «Шлях до даних мови» містить файли мовних даних (.traineddata), які використовуються для навчання механізму оптичного розпізнавання символів. Ви можете знайти файли мовних даних для всіх доступних мов у цьому репозиторії GitHub.

Ви також можете використовувати механізм Tesseract для вилучення тексту з багатомовних документів. Щоб дізнатися більше про видобування тексту з багатомовних документів, перейдіть до розділу Оптичного розпізнавання символів для багатомовних документів.

Якщо текст на екрані (оптичне розпізнавання символів)

Позначає початок умовного блоку дій залежно від того, чи з’являється заданий текст на екрані чи ні, за допомогою OCR.

Вхідні параметри

Аргумент	Необов'язково	Приймає	Значення за замовчуванням	Опис
Якщо текст	Немає	Існує, не існує	Існує	Указує, чи потрібно перевіряти наявність тексту для аналізу в зазначеному джерелі
Тип підсистеми оптичного розпізнавання символів	No	Механізм оптичного розпізнавання символів Windows, механізм Tesseract, змінний механізм оптичного розпізнавання символів	Змінна підсистеми оптичного розпізнавання символів	Тип OCR-двигуна, який слід використовувати. Виберіть попередньо налаштований механізм оптичного розпізнавання символів або налаштуйте новий.
Змінна підсистеми оптичного розпізнавання символів	No	OCREngineObject		Підсистема для оптичного розпізнавання символів
Текст для пошуку	No	Текстове значення		Текст для пошуку в указаному джерелі
Є регулярним виразом	Немає	Логічне значення	Ні	Визначає, чи слід використовувати формальний вираз для пошуку вказаного тексту
Шукати текст на	Немає	Весь екран, вікно переднього плану	Увесь екран	Визначає, чи слід шукати вказаний текст на всьому видимому екрані, чи лише у вікні переднього плану
Режим пошуку	Немає	Увесь вказаний джерело, Лише певна підобласть, Підрегіон відносно зображення	Усе вказане джерело	Визначає, чи потрібно сканувати весь екран (або вікно) або його звужену підобласть
Зображення	No	Список зображень		Зображення, які визначають підобласть (відносно верхнього лівого кута зображення) для пошуку вказаного тексту
X1	Так	Числове значення		Початкова координата X підобласті для пошуку вказаного тексту
Припустиме відхилення	Так	Числове значення	10	Указує, наскільки зображення для пошуку може відрізнятися від початково вибраного зображення
Y1	Так	Числове значення		Початкова координата Y підобласті для пошуку вказаного тексту
X1	Так	Числове значення		Початкова координата X підобласті (відносно вказаного зображення) для пошуку заданого тексту
X2	Так	Числове значення		Кінцева координата X підобласті для пошуку вказаного тексту
Y1	Так	Числове значення		Початкова координата Y підобласті (відносно вказаного зображення) для пошуку заданого тексту
Y2	Так	Числове значення		Кінцева координата Y підобласті для пошуку вказаного тексту
X2	Так	Числове значення		Кінцева координата X підобласті (відносно вказаного зображення) для пошуку заданого тексту
Y2	Так	Числове значення		Кінцева координата Y підобласті (відносно вказаного зображення) для пошуку заданого тексту
Мова Windows OCR	Немає	китайська (спрощене письмо), китайська (традиційне письмо), чеська, данська, голландська, англійська, фінська, французька, німецька, грецька, угорська, італійська, японська, корейська, норвезька, польська, португальська, румунська, російська, сербська (кирилиця), сербська (латиниця), словацька, іспанська, шведська, турецька	English	Мова тексту, який визначає обробник розпізнавання символів Windows
Використовувати іншу мову	Немає	Логічне значення	Ні	Указує, чи використовувати мову, не вказану в полі "Мова Tesseract"
Мова Tesseract	Немає	Англійська, німецька, іспанська, французька, італійська	English	Мова тексту, яку розпізнає підсистема Tesseract
Скорочення мови	No	Текстове значення		Абревіатура Тессеракт мови, яку потрібно використовувати. Наприклад, якщо дані ’eng.traineddata’, встановіть для цього параметра значення ’eng’
Шлях до мовних даних	No	Текстове значення		Шлях до папки, яка містить дані Tesseract для вказаної мови
Множник ширини зображення	No	Числове значення	1	Множник ширини зображення
Множник висоти зображення	No	Числове значення	1	Множник висоти зображення
Алгоритм зіставлення зображень	Немає	Базовий, Розширений	Базові	Який алгоритм зображення використовувати під час пошуку зображення

Нотатка

Power AutomateРушієм регулярних виразів є .NET. Щоб дізнатися більше про регулярні вирази, перейдіть до розділу Мова регулярних виразів - Короткий довідник.
Змінна опція OCR engine планується до занепаду.

Змінні, які створюються

Аргумент	Ввести	Опис
LocationOfTextFoundX	Числове значення	Координата X точки, де текст з’являється на екрані. Якщо пошук виконується у вікні переднього плану, координата, що повертається, є відносною до верхнього лівого кута вікна
LocationOfTextFoundY	Числове значення	Координата X точки, де текст з’являється на екрані. Якщо пошук виконується у вікні переднього плану, координата, що повертається, є відносною до верхнього лівого кута вікна

Винятки

Виняток	Опис
Неможливо перевірити наявність тексту в неінтерактивному режимі	Указує, що перевірити наявність тексту на екрані в неінтерактивному режимі неможливо
Неприпустимі координати підобласті	Указує, що зазначені координати підобласті неприпустимі
Не вдалося проаналізувати текст за допомогою оптичного розпізнавання символів	Указує, що сталася помилка під час спроби проаналізувати текст за допомогою оптичного розпізнавання символів
Не вдалося створити підсистему оптичного розпізнавання символів	Указує, що сталася помилка під час спроби створити підсистему оптичного розпізнавання символів
Папка шляху до даних не існує	Указує, що папка, указана для даних мови, не існує
Вибраний мовний пакет Windows не інстальовано на цьому комп’ютері	Вказує на те, що вибраний мовний пакет Windows не інстальовано на комп’ютері
Підсистема оптичного розпізнавання символів недоступна	Указує, що підсистема розпізнавання символів недоступна

Очікування тексту на екрані (OCR)

Зачекайте, доки певний текст не з’явиться/не зникне на екрані, у вікні переднього плану або відносно зображення на екрані чи у вікні переднього плану за допомогою оптичного розпізнавання символів.

Вхідні параметри

Аргумент	Необов'язково	Приймає	Значення за замовчуванням	Опис
Очікуваний текст	Немає	З’являтися, зникати	З’явиться	Указує, чого потрібно очікувати: доки зображення не з’явиться чи не зникне
Тип підсистеми оптичного розпізнавання символів	No	Механізм оптичного розпізнавання символів Windows, механізм Tesseract, змінний механізм оптичного розпізнавання символів	Змінна підсистеми оптичного розпізнавання символів	Тип OCR-двигуна, який слід використовувати. Виберіть попередньо налаштований механізм оптичного розпізнавання символів або налаштуйте новий.
Змінна підсистеми оптичного розпізнавання символів	No	OCREngineObject		Підсистема для оптичного розпізнавання символів
Текст для пошуку	No	Текстове значення		Текст для пошуку в указаному джерелі
Є регулярним виразом	Немає	Логічне значення	Ні	Визначає, чи слід використовувати формальний вираз для пошуку вказаного тексту
Шукати текст на	Немає	Весь екран, вікно переднього плану	Увесь екран	Визначає, чи слід шукати вказаний текст на всьому видимому екрані, чи лише у вікні переднього плану
Режим пошуку	Немає	Увесь вказаний джерело, Лише певна підобласть, Підрегіон відносно зображення	Усе вказане джерело	Визначає, чи потрібно сканувати весь екран (або вікно) або його звужену підобласть
Зображення	No	Список зображень		Зображення, які визначають підобласть (відносно верхнього лівого кута зображення) для пошуку вказаного тексту
X1	Так	Числове значення		Початкова координата X підобласті для пошуку вказаного тексту
Припустиме відхилення	Так	Числове значення	10	Указує, наскільки зображення для пошуку може відрізнятися від початково вибраного зображення
Y1	Так	Числове значення		Початкова координата Y підобласті для пошуку вказаного тексту
X1	Так	Числове значення		Початкова координата X підобласті (відносно вказаного зображення) для пошуку заданого тексту
X2	Так	Числове значення		Кінцева координата X підобласті для пошуку вказаного тексту
Y1	Так	Числове значення		Початкова координата Y підобласті (відносно вказаного зображення) для пошуку заданого тексту
Y2	Так	Числове значення		Кінцева координата Y підобласті для пошуку вказаного тексту
X2	Так	Числове значення		Кінцева координата X підобласті (відносно вказаного зображення) для пошуку заданого тексту
Y2	Так	Числове значення		Кінцева координата Y підобласті (відносно вказаного зображення) для пошуку заданого тексту
Мова Windows OCR	Немає	китайська (спрощене письмо), китайська (традиційне письмо), чеська, данська, голландська, англійська, фінська, французька, німецька, грецька, угорська, італійська, японська, корейська, норвезька, польська, португальська, румунська, російська, сербська (кирилиця), сербська (латиниця), словацька, іспанська, шведська, турецька	English	Мова тексту, який визначає обробник розпізнавання символів Windows
Використовувати іншу мову	Немає	Логічне значення	Ні	Указує, чи використовувати мову, не вказану в полі "Мова Tesseract"
Мова Tesseract	Немає	Англійська, німецька, іспанська, французька, італійська	English	Мова тексту, яку розпізнає підсистема Tesseract
Скорочення мови	No	Текстове значення		Абревіатура Тессеракт мови, яку потрібно використовувати. Наприклад, якщо дані ’eng.traineddata’, встановіть для цього параметра значення ’eng’
Шлях до мовних даних	No	Текстове значення		Шлях до папки, яка містить дані Tesseract для вказаної мови
Множник ширини зображення	No	Числове значення	1	Множник ширини зображення
Множник висоти зображення	No	Числове значення	1	Множник висоти зображення
Алгоритм зіставлення зображень	Немає	Базовий, Розширений	Базові	Який алгоритм зображення використовувати під час пошуку зображення
Помилка часу очікування	Немає	Логічне значення	Ні	Укажіть, що має робити дія: чекати чи ініціювати помилку після вказаного періоду часу

Нотатка

Power AutomateРушієм регулярних виразів є .NET. Щоб дізнатися більше про регулярні вирази, перейдіть до розділу Мова регулярних виразів - Короткий довідник.
Змінна опція OCR engine планується до занепаду.

Змінні, які створюються

Аргумент	Ввести	Опис
LocationOfTextFoundX	Числове значення	Координата X точки, де текст з’являється на екрані. Якщо пошук виконується у вікні переднього плану, координата, що повертається, є відносною до верхнього лівого кута вікна
LocationOfTextFoundY	Числове значення	Координата X точки, де текст з’являється на екрані. Якщо пошук виконується у вікні переднього плану, координата, що повертається, є відносною до верхнього лівого кута вікна

Винятки

Виняток	Опис
Неможливо перевірити наявність тексту в неінтерактивному режимі	Указує, що перевірити наявність тексту на екрані в неінтерактивному режимі неможливо
Неприпустимі координати підобласті	Указує, що зазначені координати підобласті неприпустимі
Не вдалося проаналізувати текст за допомогою оптичного розпізнавання символів	Указує, що сталася помилка під час спроби проаналізувати текст за допомогою оптичного розпізнавання символів
Не вдалося створити підсистему оптичного розпізнавання символів	Указує, що сталася помилка під час спроби створити підсистему оптичного розпізнавання символів
Папка шляху до даних не існує	Указує, що папка, указана для даних мови, не існує
Вибраний мовний пакет Windows не інстальовано на цьому комп’ютері	Вказує на те, що вибраний мовний пакет Windows не інстальовано на комп’ютері
Підсистема оптичного розпізнавання символів недоступна	Указує, що підсистема розпізнавання символів недоступна
Помилка часу очікування	Вказує на те, що дію не вдалося виконати через встановлений проміжок часу

Видобути текст за допомогою OCR

Витягти текст із заданого джерела за допомогою вказаного механізму оптичного розпізнавання символів.

Вхідні параметри

Аргумент	Необов'язково	Приймає	Значення за замовчуванням	Опис
Підсистема оптичного розпізнавання символів	No	Механізм оптичного розпізнавання символів Windows, механізм Tesseract, змінний механізм оптичного розпізнавання символів	Змінна підсистеми оптичного розпізнавання символів	Тип OCR-двигуна, який слід використовувати. Виберіть попередньо налаштований механізм оптичного розпізнавання символів або налаштуйте новий
Змінна підсистеми оптичного розпізнавання символів	No	OCREngineObject		Підсистема для оптичного розпізнавання символів
Джерело оптичного розпізнавання символів	Немає	Екран, Вікно переднього плану, Зображення на диску	Екран	Джерело зображення для оптичного розпізнавання символів
Шлях до файлу зображення	No	Файл		Шлях зображення, на якому буде виконано операцію оптичного розпізнавання символів
Режим пошуку	Немає	Увесь вказаний джерело, Лише певна підобласть, Підрегіон відносно зображення	Усе вказане джерело	Вибраний режим для оптичного розпізнавання символів
Image	No	Список зображень		Зображення, яке буде використано для звуження сканування до підобласті, яка є відносною до вказаного зображення
Припустиме відхилення	Так	Числове значення	10	Указує, наскільки зображення може відрізнятися від початково вибраного зображення
X1	Так	Числове значення		Початкова координата X підобласті для обмеження сканування
X2	Так	Числове значення		Кінцева координата X підобласті для обмеження сканування
Y1	Так	Числове значення		Початкова координата Y підобласті для обмеження сканування
Y2	Так	Числове значення		Кінцева координата Y підобласті для обмеження сканування
Мова Windows OCR	Немає	китайська (спрощене письмо), китайська (традиційне письмо), чеська, данська, голландська, англійська, фінська, французька, німецька, грецька, угорська, італійська, японська, корейська, норвезька, польська, португальська, румунська, російська, сербська (кирилиця), сербська (латиниця), словацька, іспанська, шведська, турецька	English	Мова тексту, який визначає обробник розпізнавання символів Windows
Використовувати іншу мову	Немає	Логічне значення	Ні	Указує, чи використовувати мову, не вказану в полі "Мова Tesseract"
Мова Tesseract	Немає	Англійська, німецька, іспанська, французька, італійська	English	Мова тексту, яку розпізнає підсистема Tesseract
Скорочення мови	No	Текстове значення		Абревіатура Тессеракт мови, яку потрібно використовувати. Наприклад, якщо дані ’eng.traineddata’, встановіть для цього параметра значення ’eng’
Шлях до мовних даних	No	Текстове значення		Шлях до папки, яка містить дані Tesseract для вказаної мови
Множник ширини зображення	No	Числове значення	1	Множник ширини зображення
Множник висоти зображення	No	Числове значення	1	Множник висоти зображення
Очікувати появи зображення	Немає	Логічне значення	Так	Указує, де слід очікувати появи зображення: на екрані або у вікні переднього плану
Час очікування	No	Числове значення	5	Указує час очікування на виконання операції, перш ніж визнати дію невиконаною
Алгоритм зіставлення зображень	Немає	Базовий, Розширений	Базові	Який алгоритм зображення використовувати під час пошуку зображення

Нотатка

Змінна опція OCR engine планується до занепаду.

Змінні, які створюються

Аргумент	Ввести	Опис
OcrText	Текстове значення	Результат після вилучення тексту

Винятки

Виняток	Опис
Не вдалося видобути текст за допомогою оптичного розпізнавання символів	Указує, що сталася помилка під час спроби видобути текст із заданого джерела за допомогою оптичного розпізнавання символів
Файл зображення не знайдено	Указує, що файл не існує за зазначеним шляхом
Зображення landmark не знайдено	Указує, що зображення landmark не існує
Неможливо отримати текст з екрана в неінтерактивному режимі	Указує, що отримати текст з екрана в неінтерактивному режимі неможливо
Не вдалося створити підсистему оптичного розпізнавання символів	Указує, що сталася помилка під час спроби створити підсистему оптичного розпізнавання символів
Папка шляху до даних не існує	Указує, що папка, указана для даних мови, не існує
Вибраний мовний пакет Windows не інстальовано на цьому комп’ютері	Вказує на те, що вибраний мовний пакет Windows не інстальовано на комп’ютері
Підсистема оптичного розпізнавання символів недоступна	Указує, що підсистема розпізнавання символів недоступна

Поділитися через

Дії OCR

Використання механізму оптичного розпізнавання символів Windows

Використовуйте механізм оптичного розпізнавання символів Tesseract

Якщо текст на екрані (оптичне розпізнавання символів)

Вхідні параметри

Змінні, які створюються

Винятки

Очікування тексту на екрані (OCR)

Вхідні параметри

Змінні, які створюються

Винятки

Видобути текст за допомогою OCR

Вхідні параметри

Змінні, які створюються

Винятки

Додаткові ресурси