Požadavky a omezení pro zpracování předem připravených dokumentů v SharePointu

Článek
01/23/2025

Následující části popisují klíčové faktory, které je potřeba vzít v úvahu při plánování použití předem připraveného modelu zpracování dokumentů.

Zpracování smlouvy

Ikona	Popis
	Podporované typy souborů Tento model podporuje následující typy souborů: .bmp, .jpeg, .pdf, .png a .tiff.
	Podporované jazyky Tento model podporuje pouze anglické jazykové kontrakty.
	Důležité informace o OCR Tento model používá technologii optického rozpoznávání znaků (OCR) ke skenování .pdf souborů, souborů obrázků a .tiff souborů. Zpracování OCR funguje nejlépe u dokumentů, které splňují následující požadavky: - Formát souboru .jpg, .png nebo .pdf (text nebo naskenovaný). Textové .pdf soubory jsou lepší, protože při extrakci a umístění znaků nebudou žádné chyby. - U .pdf a .tiff souborů je možné zpracovat až 2 000 stránek. – Velikost souboru musí být menší než 50 MB. - U obrázků musí být rozměry mezi 50 x 50 a 10 000 x 10 000 pixelů. - Pro .pdf soubory musí mít rozměry maximálně 11 x 17 palců, což odpovídá formátu papíru Legal nebo A3 a menší. – Celková velikost trénovacích dat je 500 stránek nebo méně.
	Prostředí Multi-Geo Při nastavování syntexu v prostředí Microsoft 365 Multi-Geo ho můžete nakonfigurovat tak, aby používal typ modelu pouze v centrálním umístění. Pokud chcete tento typ modelu použít v satelitním umístění, kontaktujte podporu Microsoftu.
	Knihovny s více modely Pokud se ve stejné knihovně použijí dva nebo více natrénovaných modelů, soubor se klasifikuje pomocí modelu, který má nejvyšší průměrné skóre spolehlivosti. Extrahované entity pocházejí pouze z použitého modelu.

Zpracování faktur

Ikona	Popis
	Podporované typy souborů Tento model podporuje následující typy souborů: .bmp, .jpeg, .pdf, .png a .tiff.
	Podporované jazyky Tento model podporuje faktury v angličtině, španělštině, němčině, francouzštině, italštině, portugalštině a holandštině.
	Důležité informace o OCR Tento model používá technologii optického rozpoznávání znaků (OCR) ke skenování .pdf souborů, souborů obrázků a .tiff souborů. Zpracování OCR funguje nejlépe u dokumentů, které splňují následující požadavky: - Formát souboru .jpg, .png nebo .pdf (text nebo naskenovaný). Textové .pdf soubory jsou lepší, protože při extrakci a umístění znaků nebudou žádné chyby. - U .pdf a .tiff souborů je možné zpracovat až 2 000 stránek. – Velikost souboru musí být menší než 50 MB. - U obrázků musí být rozměry mezi 50 x 50 a 10 000 x 10 000 pixelů. - Pro .pdf soubory musí mít rozměry maximálně 11 x 17 palců, což odpovídá formátu papíru Legal nebo A3 a menší. – Celková velikost trénovacích dat je 500 stránek nebo méně.
	Prostředí Multi-Geo Při nastavování syntexu v prostředí Microsoft 365 Multi-Geo ho můžete nakonfigurovat tak, aby používal typ modelu pouze v centrálním umístění. Pokud chcete tento typ modelu použít v satelitním umístění, kontaktujte podporu Microsoftu.
	Knihovny s více modely Pokud se ve stejné knihovně použijí dva nebo více natrénovaných modelů, soubor se klasifikuje pomocí modelu, který má nejvyšší průměrné skóre spolehlivosti. Extrahované entity pocházejí pouze z použitého modelu.

Zpracování příjmu

Ikona	Popis
	Podporované typy souborů Tento model podporuje následující typy souborů: .bmp, .jpeg, .pdf, .png a .tiff.
	Podporované jazyky Tento model podporuje účtenky v angličtině, chorvatštině, češtině, dánštině, holandštině, finštině, němčině, maďarštině, italštině, japonštině, lotyštině, litevštině, norštině, portugalštině, španělštině, švédštině a vietnamštině.
	Důležité informace o OCR Tento model používá technologii optického rozpoznávání znaků (OCR) ke skenování .pdf souborů, souborů obrázků a .tiff souborů. Zpracování OCR funguje nejlépe u dokumentů, které splňují následující požadavky: - Formát souboru .jpg, .png nebo .pdf (text nebo naskenovaný). Textové .pdf soubory jsou lepší, protože při extrakci a umístění znaků nebudou žádné chyby. - U .pdf a .tiff souborů je možné zpracovat až 2 000 stránek. – Velikost souboru musí být menší než 50 MB. - U obrázků musí být rozměry mezi 50 x 50 a 10 000 x 10 000 pixelů. - Pro .pdf soubory musí mít rozměry maximálně 11 x 17 palců, což odpovídá formátu papíru Legal nebo A3 a menší. – Celková velikost trénovacích dat je 500 stránek nebo méně.
	Prostředí Multi-Geo Při nastavování syntexu v prostředí Microsoft 365 Multi-Geo ho můžete nakonfigurovat tak, aby používal typ modelu pouze v centrálním umístění. Pokud chcete tento typ modelu použít v satelitním umístění, kontaktujte podporu Microsoftu.
	Knihovny s více modely Pokud se ve stejné knihovně použijí dva nebo více natrénovaných modelů, soubor se klasifikuje pomocí modelu, který má nejvyšší průměrné skóre spolehlivosti. Extrahované entity pocházejí pouze z použitého modelu.

Zpracování citlivých informací

Ikona	Popis
	Podporované typy souborů Tento model podporuje následující typy souborů: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls a .xlsx.
	Podporované jazyky Tento model podporuje následující jazyky: viz podporované jazyky. Tento model také podporuje jazyky pro ručně psaný i tištěný text.
	Důležité informace o OCR Tento model používá technologii optického rozpoznávání znaků (OCR) ke skenování .pdf souborů, souborů obrázků a .tiff souborů. Zpracování OCR funguje nejlépe u dokumentů, které splňují následující požadavky: - Formát souboru .jpg, .png nebo .pdf (text nebo naskenovaný). Textové .pdf soubory jsou lepší, protože při extrakci a umístění znaků nebudou žádné chyby. - U .pdf a .tiff souborů je možné zpracovat až 2 000 stránek. – Velikost souboru musí být menší než 50 MB. - U obrázků musí být rozměry mezi 50 x 50 a 10 000 x 10 000 pixelů. - Pro .pdf soubory musí mít rozměry maximálně 11 x 17 palců, což odpovídá formátu papíru Legal nebo A3 a menší. – Celková velikost trénovacích dat je 500 stránek nebo méně. Podporuje jazyky pro ručně psaný i tištěný text.
	Prostředí Multi-Geo Při nastavování syntexu v prostředí Microsoft 365 Multi-Geo ho můžete nakonfigurovat tak, aby používal typ modelu pouze v centrálním umístění. Pokud chcete tento typ modelu použít v satelitním umístění, kontaktujte podporu Microsoftu.
	Knihovny s více modely Pokud se ve stejné knihovně použijí dva nebo více natrénovaných modelů, soubor se klasifikuje pomocí modelu, který má nejvyšší průměrné skóre spolehlivosti. Extrahované entity pocházejí pouze z použitého modelu.

Jednoduché zpracování dokumentů

Ikona	Popis
	Podporované typy souborů Tento model podporuje následující typy souborů: .bmp, .jpeg, .pdf, .png a .tiff.
	Podporované jazyky Tento model podporuje dokumenty ve více než 100 jazycích.
	Důležité informace o OCR Tento model používá technologii optického rozpoznávání znaků (OCR) ke skenování .pdf souborů, souborů obrázků a .tiff souborů. Zpracování OCR funguje nejlépe u dokumentů, které splňují následující požadavky: - Formát souboru .jpg, .png nebo .pdf (text nebo naskenovaný). Textové .pdf soubory jsou lepší, protože při extrakci a umístění znaků nebudou žádné chyby. - U .pdf a .tiff souborů je možné zpracovat až 2 000 stránek. – Velikost souboru musí být menší než 50 MB. - U obrázků musí být rozměry mezi 50 x 50 a 10 000 x 10 000 pixelů. - Pro .pdf soubory musí mít rozměry maximálně 11 x 17 palců, což odpovídá formátu papíru Legal nebo A3 a menší. – Celková velikost trénovacích dat je 500 stránek nebo méně.
	Prostředí Multi-Geo Při nastavování syntexu v prostředí Microsoft 365 Multi-Geo ho můžete nakonfigurovat tak, aby používal typ modelu pouze v centrálním umístění. Pokud chcete tento typ modelu použít v satelitním umístění, kontaktujte podporu Microsoftu.
	Knihovny s více modely Pokud se ve stejné knihovně použijí dva nebo více natrénovaných modelů, soubor se klasifikuje pomocí modelu, který má nejvyšší průměrné skóre spolehlivosti. Extrahované entity pocházejí pouze z použitého modelu.