Поділитися через


Розпізнавання тексту готової моделі

Попередньо вбудована модель розпізнавання тексту витягує слова з документів і зображень у потоки символів, придатні для машинного зчитування. Він використовує найсучасніше оптичне розпізнавання символів (OCR) для виявлення друкованого та рукописного тексту на зображеннях.

Ця модель обробляє зображення та файли документів для вилучення рядків друкованого або рукописного тексту.

Використовувати в Power Apps

Готова модель Розпізнавання тексту доступна в Power Apps режимі використання компонента розпізнавання тексту. Додаткові відомості: Використовуйте компонент розпізнавання тексту в Power Apps

Використання в Power Automate

Інформацію про те, як використовувати цю модель у, Power Automate наведено в статті Використання вбудованої моделі Розпізнавання тексту Power Automate.

Підтримувана мова, формат і розмір

Файли, які можна сканувати за допомогою моделі Розпізнавання тексту, повинні мати такі характеристики:

  • Мова для друкованого тексту: африкаанс, албанська, ангіка (деванагірі), арабська, астурійська, авадхі-гінді (деванагірі), азербайджанська (латиниця), багелі, баскська, білоруська (кирилиця), білоруська (латиниця), бходжпурі-гінді (деванагірі), біслама, бодо (деванагірі), боснійська (латиниця), браджбха, бретонська, болгарська, бунделі, бурятська (кирилиця), каталонська, себуано, чамлінг, чаморро, чхаттісгархі (деванагірі), китайська (спрощена), китайська (традиційна), корнська, корсиканська, кримськотатарська (латиниця), хорватська, чеська, данська, дарі, дімал (деванагірі), догрі (деванагірі), голландська, англійська, ерзя (кирилиця), естонська, фарерська, фіджійська, філіппінська, фінська, французька, фріульська, гагаузька (латиниця), галісійська, німецька, гільбертська, гонді (деванагірі), гренландська, гурунг (деванагірі), гаїтянська креольська, халбі (деванагірі), хані, хар’янві, гавайська, хінді, хмонг дау (латиниця), хо (деванагірі), угорська, ісландська, інарі самі, індонезійська, інтерлінгва, інуктитут (латиниця), ірландська, італійська, японська, яунсарі (деванагірі), яванська, Kabuverdianu, Kachin (латиниця), kangri (деванагірі), карачаєво-балкарська, кара-калпак (кирилиця), кара-калпак (латиниця), кашубська, казахська (кирилиця), казахська (латиниця), khaling, khasi, k’iche’, корейська, корку, косрійська, кумицька (кирилиця), курдська (арабська), курдська (латиниця), курух (деванагірі), киргизька (кирилиця), лакота, латинська, литовська, нижньосорбська, луле самі, люксембурзька, махасу пахарі (деванагірі), малайська (латиниця), мальтійська, мальтійська (деванагірі), менська, маорі, маратхі, монгольська (кирилиця), Чорногорська (кирилиця), чорногорська (латиниця), неаполітанська, непальська, ніуейська, ногайська, північносаамська (латиниця), норвезька, окситанська, осетинська, пушту, перська, польська, португальська, пенджабська (арабська), румунська, румунська, ретороманська, російська, садрі (деванагірі), самоанська (латиниця), санскрит (деванагарі), санталі(деванагірі), шотландська, шотландська гельська, сербська (латиниця), шерпа (деванагірі), сірмаурі (деванагірі), скотт-самська, словацька, словенська, сомалійська (арабська), південна саамська, іспанська, суахілі (латиниця), шведська, таджицька (кирилиця), татарська (латиниця), тетум, тханмі, тонганська, туркменська (латиниця), тувинська, верхньосорбська, урду, уйгурська (арабська), узбецька (арабська), узбецька (кирилиця), узбецька (латиниця), волапюк, вальзер, валлійська, західнофризька, юкатекська майя, чжуан, зулу
  • Мова для рукописного тексту: англійська, китайська (спрощене письмо), французька, німецька, італійська, японська, корейська, португальська, іспанська
  • Формат приготування:
    • JPG
    • PNG
    • BMP
    • PDF
  • Розмір: максимум 20 МБ
  • Для PDF-документів обробляються лише перші 2 000 сторінок.

Висновок моделі

Якщо документ виявлено, модель розпізнавання тексту виводить таку інформацію:

  • Результати: Список рядків, витягнутих із вхідного тексту.
  • Текст: виявлено рядки, що містять рядок тексту.
  • BoundingBox: чотири значення, що представляють обмежувальну рамку, описані за допомогою верхньої та лівої позицій, а також її ширини та висоти.

Обмеження

Дія Межа Період продовження
Розпізнавання тексту дзвінків (за середовищем) 480 60 секунд

Тренування: Розпізнавання тексту за допомогою AI Builder (модуль)