Изисквания и ограничения за модел за обработка на документи
Поддържани езици
Модел за документи с фиксиран шаблон
Следните езици се поддържат при обучение на модел за обработка на документи и избиране на документи с фиксиран шаблон като тип документ:
Абаза, Абхазки, Ахинезе, Аколи, Адангме, Адиге, Афар, Африканс, Акан, Албански, Алгонкин, Ангика (Деванагари), Арабски, Астурски, Асу (Танзания), Аварич, Ауадхи-Хинди (Деванагари), Аймара, Азербайджански (латиница), Бафия, Багели, Бамбара, Башкир, Баски, Беларуски (кирилица), Беларуски (латиница), Бемба (Замбия), Бемба (Замбия), Бхожпури-хинди (деванагари), Бикол, Бини, Бислама, Бодо (деванагари), босненски (латиница), Браджбха, бретонски, български, Бундели, Бурят (кирилица), каталонски, Себуано, Chamling, Chamorro, чеченски, Chhattisgarhi (Devanagari), Chiga, китайски опростен, китайски традиционен, Choctaw, Chukot, Chuvash, Cornish, корсикански, Cree, Creek, кримскотатарски татарски (латински), хърватски, врана, чешки, датски, Dargwa, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dungan, холандски, Efik, английски, Erzya (кирилица), естонски, фарьорски, фиджийски, филипински, фински, Fon, френски, фриулски, Ga, Gagauz (латински), галисийски, Ganda, Gayo, немски, Gilbertese, Gondi (деванагари), гръцки, Гренландски, Гуарани, Гурунг (Деванагари), Гусии, Хаитянски креолски, Халби (Деванагари), Хани, Харянви, Хавайски, Иврит, Хереро, Хилигайнон, Хинди, Хмонг Дау (латиница), Хо (Деванагири), Унгарски, Ибан, Исландски, Игбо, Илоко, Инари Сами, Индонезийски, Ингуш, Интерлингва, Инуктитут (латиница), Ирландски, Италиански, Японски, Джаунсари (Деванагари), Явански, Джола-Фони, Кабардски, Кабувердиану, Качин (латиница), Календжин, Калмик, Кангри (Деванагари), Канури, Карачаево-Балкар, Кара-Калпак (кирилица), Кара-Калпак (латиница), кашубски, казахски (кирилица), казахски (латиница), хакас, халинг, хаси, к'иче', кикую, килдин сами, киняруанда, коми, конго, корейски, корку, коряк, косрейски, кпеле, куаняма, кумик (кирилица), кюрдски (арабски), кюрдски (латиница), курук (деванагари), киргизстан (кирилица), лак, лакота, латински, латвийски, лезгийски, лингала, литовски, долносорбски, лози, люле сами, луо (кения и танзания), люксембургски, луя луй, македонски, мачаме, мадурезе, махаруски (деванагари), Makhuwa-Meetto, Makonde, Malagasy, Malay (Latin), Maltese, Malto (Devanagari), Mandinka, Manx, Maori, Mapudungun, Marathi, Mari (Russia), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, Mongolian (кирилица), Mongondow, Montenegrin (кирилица), Montenegrin (латиница), Morisyen, Mundang, Nahuatl, Navajo, Ndonga, Neapolitan, Nepali, Ngomba, Niuean, Nogay, North Ndebele, Northern Sami (Latin), Norwegian, Nyanja, Nyankole, Nzima, Occitan, Ojibwa, Oromo, Ossetic, Pampanga, Pangasinan, Papiamento, пущу, педи, персийски, полски, португалски, пенджабски (арабски), кечуа, рипуарски, румънски, реторомански, рунди, руски, руа, садри (деванагари), сакха, самбуру, самоански (латински), санго, сангу (габон), санскрит (деванагари), сантали(деванагири), шотландски, шотландски келтски, сена, сръбски (кирилица), сръбски (латиница), шамбала, шерпа (деванагари), шона, сиксика, сирмаури (деванагари), сколт сами, словашки, словенски, сога, сомалийски (арабски), сомалийски (латински), сонгхай, южен ндебеле, южен Алтай, Южен Сами, Южен Сото, испански, сундански, суахили (латиница), свати, шведски, табасарански, тачелхитски, таитянски, тайта, таджикски (кирилица), тамилски, татарски (кирилица), татарски (латиница), тесо, тетум, тайландски, тангми, ток писин, тонган, цонга, цвана, турски, туркменски (латиница), тувански, удмуртски, уйгурски (кирилица), украински, горносорбски, урду, уйгурски (арабски), узбекски (арабски), узбекски (кирилица), узбекски (латиница), виетнамски, волапюк, вунджо, валзер, уелски, западнофризийски, Уолоф, Кхоса, Юкатек Мая, Сапотек, Зарма, Джуанг, Зулу
Образец на общи документи
Следните езици се поддържат при обучение на модел за обработка на документи и избиране на общи документи като вид документ.
африканс, албански, арабски, български, китайски (хан (опростен вариант)), китайски (хан (традиционен вариант)), хърватски, чешки, датски, холандски, естонски, фински, френски, немски, иврит, хинди, унгарски, индонезийски, италиански, японски, корейски, латвийски, литовски, македонски, маратхи, новогръцки (1453-), непалски (макроезик), норвежки, панджабски, персийски, полски, португалски, румънски, руски, словашки, словенски, сомалийски (арабски), сомалийски (латински), испански, суахили (макроезик), шведски, Тамилски, Тайландски, Турски, Украински, Урду, Виетнамски
Изисквания
Обработката на документи работи по входни документи, които отговарят на следните изисквания:
- JPG, PNG или PDF формат (текстов или сканиран). Вградените в текст PDF файлове са по-добри, защото няма да има грешки при извличането и местоположението на знаците.
- TIFF файловете не могат да се използват за обучение. Ще трябва да използвате документи в PDF, JPG или PNG формат, за да обучите модел. След като моделът е обучен, той може да извлича данни от TIFF файлове, когато моделът се използва в Power Automate облачен поток.
- Ако вашите PDF файлове са заключени с парола, трябва да премахнете ключалката, преди да ги изпратите.
- Максималният размер на документа за обработка не трябва да надвишава 20 MB.
- За изображения размерите трябва да са между 50 × 50 и 10 000 × 10 000 пиксела.
- Ако се сканира от хартиени документи, сканирането трябва да бъде с висококачествени изображения.
- Можете да създадете до 200 колекции на модел.
- В облачен поток ограничението на полетата, които могат да бъдат маркирани за обработка на документи, е 300.
Бележка
- Извличането на подписи от документи в момента не се поддържа.
- Полетата, които се разделят между границите на страниците, в момента не се поддържат.
- Редовете, които преминават от една страница на друга, в момента не се поддържат.
Съвет за оптимизация
Научете как да подобрите ефективността на моделите за обработка на документи.