Tekstin tunnistuksen valmis malli
Valmiit tekstintunnistusmallit poimivat sanoja asiakirjoista ja kuvista koneluettaviksi merkkitietovirroiksi. Se käyttää uusimman tekniikan mukaista optista merkintunnistusta (OCR), jolla tulostettu ja käsinkirjoitettu teksti kuvissa tunnistetaan.
Tämä malli käsittelee kuvat ja asiakirjat siten, että se poimii niistä rivejä tulostettua, painettua tai käsinkirjoitettua tekstiä.
Käyttö Power Appsissa
Valmis tekstintunnistusmalli on käytettävissä Power Appsissa tekstintunnistuskomponentin avulla. Lisätietoja: Tekstintunnistuskomponentin käyttäminen Power Appsissa
Käytetään Power Automatessa
Jos haluat tietoja siitä, miten tätä mallia käytetään Power Automatessa, katso kohta Valmiin tekstintunnistusmallin käyttäminen Power Automatessa.
Tuettu kieli, muoto ja koko
Jos haluat käsitellä tiedoston tekstintunnistusmallilla, sen on täytettävä seuraavat vaatimukset:
- Painetun tekstin kieli: afrikaans, albania, angika (Devanagiri), arabia, asturia, awadhi-hindi (devanagiri), azerbaidžani (latinalainen), bagheli, baski, valkovenäjä (kyrillinen), valkovenäjä (latinalainen), bhojpuri-hindi (Devanagiri), bislama, bodø (devanagiri), bosnia (latinalainen), brajbha, breton, bulgaria, bundeli, burjaatti (kyrillinen), katalaani, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kiina (yksinkertaistettu), kiina (perinteinen), korni, korsika, Krimin tataari (latinalainen), kroatia, tšekki, tanska, dari, dhimal (Devanagiri), dogri (Devanagiri), hollanti, englanti, erzya (kyrillinen), viro, färsaarelainen, fidžiläinen, filippiiniläinen, suomi, ranska, friuli, gagauz (latinalainen), galego, saksa, gilbertese, gondi (Devanagiri), grönlanti, gurung (Devanagiri), haitilainen kreoli, halbi (Devanagiri), hani, haryanvi, havaiji, hindi, hmong daw (latinalainen), ho(Devanagiri), unkari, islanti, inarinsaame, indonesia, interlingua, inuktitut (latinalainen), irlanti, italia, japani, jaunsari (Devanagiri), jaava, Kabuverdianu, Kachin (latinalainen), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kyrillinen), Kara-Kalpak (latinalainen), Kašubi, Kazakki (kyrillinen), Kazakki (latinalainen), Khaling, Khasi, K'iche', Korea, Korku, Koryak, Kosraean, Kumyk (kyrillinen), Kurdi (arabia), Kurdi (latinalainen), Kurukh (Devanagiri), Kirgisia (kyrillinen), Lakota, latinalainen, liettua, Ala-Sorbia, Luulajansaame, Luxemburg, Mahasu Pahari (Devanagiri), malaiji (latinalainen), Malta, Malto (Devanagiri), Manx, Maori, Marathi, Mongolia (kyrillinen), Montenegro (kyrillinen), Montenegro (latinalainen), napolilainen, nepalilainen, niuean, nogay, pohjoissaame (latinalainen), norja, oksitaani, osseetti, pašto, persia, puola, portugali, punjabi (arabia), ripuaari, romania, roomalainen, venäjä, sadri (devanagiri), samoa (latinalainen), sanskritin kieli (devanagari), santali (Devanagiri), skotlantilainen, skotlantilainen gaeli, serbia (latinalainen), sherpa (Devanagiri), sirmauri (Devanagiri), koltansaame, slovakki, sloveeni, somali (arabia), eteläsaame, espanja, swahili (latinalainen), ruotsi, tadžikistani (kyrillinen), tataari (latinalainen), tetum, thangmi, tonga, turkki, turkmeeni (latinalainen), tuvan, yläsorbi, urdu, uiguuri (arabia), uzbekki (arabialainen), uzbekki (kyrillinen), uzbekki (latinalainen), volapük, walser, kymri, länsifriisi, yucatec maya, zhuang, zulu
- Käsinkirjoitetun tekstin kieli: englanti, espanja, italia, japani, kiina (yksinkertaistettu), korea, portugali, ranska, saksa
- Muoto:
- JPG
- PNG
- BMP
- Koko: enintään 20 Mt
- PDF-asiakirjoissa käsitellään vain ensimmäiset 2 000 sivua.
Mallituloste
Jos asiakirja tunnistetaan, tekstintunnistusmalli tuottaa seuraavat tiedot:
- Tulokset: Luettelo syötetekstistä poimituista riveistä.
- Teksti: havaitun tekstirivin sisältävät merkkijonot.
- BoundingBox: Neljä rajausaluetta edustavaa arvoa, jotka kuvataan käyttämällä ylä- ja vasemmanpuoleisia sijainteja sekä sen leveyttä ja korkeutta.
Rajoitukset
Toiminto | Raja | Uusimisjakso |
---|---|---|
Tekstintunnistuskutsut (ympäristöä kohden) | 480 | 60 sekuntia |