Přehled optického rozpoznávání znaků v SharePointu
Poznámka
Až do června 2025 si můžete vyzkoušet omezené množství optického rozpoznávání znaků a dalších vybraných služeb obsahu, pokud máte nastavené účtování s průběžným platbou . Informace a omezení najdete v tématu Vyzkoušení Microsoft Syntex a prozkoumání jejích služeb.
Služba optického rozpoznávání znaků (OCR) v SharePointu umožňuje extrahovat tištěný nebo ručně psaný text z obrázků a dokumentů. Mezi příklady obrázků patří plakáty, kresby a popisky produktů. Mezi příklady dokumentů patří články, sestavy, formuláře a faktury.
Text se obvykle extrahuje jako slova, řádky textu a odstavce nebo bloky textu, což umožňuje přístup k digitální verzi naskenovaného textu. Extrahované informace se indexují při hledání a dají se zpřístupnit pro funkce dodržování předpisů, jako je ochrana před únikem informací (DLP).
Například povolíte službu OCR a pak do knihovny dokumentů přidáte soubory obrázků. Funkce automaticky prohledá soubory obrázků, extrahuje příslušný text a zpřístupní text z obrázků pro vyhledávání a indexování. Tato funkce umožňuje rychle a přesně najít klíčová slova a fráze, které hledáte.
Požadavky a omezení
Podporované typy souborů
Koncový bod | Podporované typy souborů |
---|---|
SharePoint a OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf |
Teams, Exchange a zařízení s Windows | .bmp, .png, .jpeg, .jpg, .tiff, and .pdf |
Kromě pdf založeného na obrázku podporuje SharePoint OCR hybridní PDF (text plus obrázek PDF). Nově nahrané hybridní soubory PDF budou zpracovány službou OCR.
Poznámka
Když použijete OCR u souboru obrázku, text se uloží do sloupce Extrahovaná textová metadata. Když použijete OCR u souboru PDF nebo TIFF, extrahovaný text se indexuje při hledání, ale není k dispozici ve sloupci metadat.
Podporované jazyky
Služba OCR podporuje více než 150 jazyků.
Podporovaná umístění a řešení
Služba OCR podporuje několik řešení, jak je znázorněno v následující tabulce. Podrobnosti o řešeních dodržování předpisů najdete v tématu Podporovaná umístění a řešení v Microsoft Purview.
Umístění | Podporované řešení |
---|---|
Exchange | Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním. Pro řešení dodržování předpisů je k dispozici text. |
Sharepointové weby | Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním. Pro řešení dodržování předpisů je k dispozici text. |
Účty úložiště OneDrive | Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním. Pro řešení dodržování předpisů je k dispozici text. |
Zpráva chatu a kanálu Teams | Pro řešení dodržování předpisů je k dispozici text. |
Zařízení | Pro řešení dodržování předpisů je k dispozici text. |
Omezení souborů
Obrázky musí být menší než 50 MB.
Obrázky musí být alespoň 50 × 50 pixelů a nesmí být větší než 16 000 × 16 000 pixelů.
Obrázky nahrané po povolení technologie OCR jsou jediné obrázky, které se kontrolují.
Obrázky vložené do dokumentů Office se nepodporují.