Sdílet prostřednictvím


Přehled optického rozpoznávání znaků v SharePointu

Poznámka

Až do června 2025 si můžete vyzkoušet omezené množství optického rozpoznávání znaků a dalších vybraných služeb obsahu, pokud máte nastavené účtování s průběžným platbou . Informace a omezení najdete v tématu Vyzkoušení Microsoft Syntex a prozkoumání jejích služeb.

Služba optického rozpoznávání znaků (OCR) v SharePointu umožňuje extrahovat tištěný nebo ručně psaný text z obrázků a dokumentů. Mezi příklady obrázků patří plakáty, kresby a popisky produktů. Mezi příklady dokumentů patří články, sestavy, formuláře a faktury.

Text se obvykle extrahuje jako slova, řádky textu a odstavce nebo bloky textu, což umožňuje přístup k digitální verzi naskenovaného textu. Extrahované informace se indexují při hledání a dají se zpřístupnit pro funkce dodržování předpisů, jako je ochrana před únikem informací (DLP).

Například povolíte službu OCR a pak do knihovny dokumentů přidáte soubory obrázků. Funkce automaticky prohledá soubory obrázků, extrahuje příslušný text a zpřístupní text z obrázků pro vyhledávání a indexování. Tato funkce umožňuje rychle a přesně najít klíčová slova a fráze, které hledáte.

Požadavky a omezení

Podporované typy souborů

Koncový bod Podporované typy souborů
SharePoint a OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf
Teams, Exchange a zařízení s Windows .bmp, .png, .jpeg, .jpg, .tiff, and .pdf

Kromě pdf založeného na obrázku podporuje SharePoint OCR hybridní PDF (text plus obrázek PDF). Nově nahrané hybridní soubory PDF budou zpracovány službou OCR.

Poznámka

Když použijete OCR u souboru obrázku, text se uloží do sloupce Extrahovaná textová metadata. Když použijete OCR u souboru PDF nebo TIFF, extrahovaný text se indexuje při hledání, ale není k dispozici ve sloupci metadat.

Podporované jazyky

Služba OCR podporuje více než 150 jazyků.

Podporovaná umístění a řešení

Služba OCR podporuje několik řešení, jak je znázorněno v následující tabulce. Podrobnosti o řešeních dodržování předpisů najdete v tématu Podporovaná umístění a řešení v Microsoft Purview.

Umístění Podporované řešení
Exchange Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním.
Pro řešení dodržování předpisů je k dispozici text.
Sharepointové weby Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním.
Pro řešení dodržování předpisů je k dispozici text.
Účty úložiště OneDrive Text je k dispozici pro hledání koncových uživatelů a řešení řízených vyhledáváním.
Pro řešení dodržování předpisů je k dispozici text.
Zpráva chatu a kanálu Teams Pro řešení dodržování předpisů je k dispozici text.
Zařízení Pro řešení dodržování předpisů je k dispozici text.

Omezení souborů

  • Obrázky musí být menší než 50 MB.

  • Obrázky musí být alespoň 50 × 50 pixelů a nesmí být větší než 16 000 × 16 000 pixelů.

  • Obrázky nahrané po povolení technologie OCR jsou jediné obrázky, které se kontrolují.

  • Obrázky vložené do dokumentů Office se nepodporují.