次の方法で共有


SharePoint での事前構築済みドキュメント処理の要件と制限事項

次のセクションでは、事前構築済みのドキュメント処理モデルを使用する際に考慮すべき重要な要素について説明します。

契約処理

アイコン 説明
ファイル シンボル。 サポートされているファイルの種類
このモデルでは、.bmp、.jpeg、.pdf、.png、.tiffのファイルの種類がサポートされています。
会話記号。 サポートされている言語
このモデルでは、英語のコントラクトのみがサポートされます。
段落記号。 OCR に関する考慮事項
このモデルでは、光学式文字認識 (OCR) テクノロジを使用して、.pdf ファイル、イメージ ファイル、および.tiff ファイルをスキャンします。 OCR 処理は、次の要件を満たすドキュメントで最適に機能します。
- .jpg、.png、または .pdf のファイル形式 (テキストまたはスキャン)。 文字の抽出と場所にエラーが発生しないため、テキスト埋め込み .pdf ファイルの方が優れています。
- .pdf ファイルと.tiffファイルの場合、最大 2,000 ページを処理できます。
- ファイル サイズは 50 MB 未満にする必要があります。
- 画像の場合、寸法は 50 x 50 ~ 10,000 x 10,000 ピクセルである必要があります。
- .pdf ファイルの場合、サイズは最大 11 x 17 インチで、Legal または A3 の用紙サイズに対応し、小さくする必要があります。
- トレーニング データの合計サイズは 500 ページ以下です。
地球記号。 Multi-Geo 環境
Microsoft 365 Multi-Geo 環境で Syntex を設定する場合は、中央の場所でモデルの種類を使用するようにのみ構成できます。 サテライトの場所でこのモデルの種類を使用する場合は、Microsoft サポートにお問い合わせください。
オブジェクト シンボル。 マルチモデル ライブラリ
2 つ以上のトレーニング済みモデルが同じライブラリに適用されている場合、ファイルは、平均信頼度スコアが最も高いモデルを使用して分類されます。 抽出されたエンティティは、適用されたモデルからのみ取得されます。

請求書処理

アイコン 説明
ファイル シンボル。 サポートされているファイルの種類
このモデルでは、.bmp、.jpeg、.pdf、.png、.tiffのファイルの種類がサポートされています。
会話記号。 サポートされている言語
このモデルでは、英語、スペイン語、ドイツ語、フランス語、イタリア語、ポルトガル語、オランダ語の請求書がサポートされています。
段落記号。 OCR に関する考慮事項
このモデルでは、光学式文字認識 (OCR) テクノロジを使用して、.pdf ファイル、イメージ ファイル、および.tiff ファイルをスキャンします。 OCR 処理は、次の要件を満たすドキュメントで最適に機能します。
- .jpg、.png、または .pdf のファイル形式 (テキストまたはスキャン)。 文字の抽出と場所にエラーが発生しないため、テキスト埋め込み .pdf ファイルの方が優れています。
- .pdf ファイルと.tiffファイルの場合、最大 2,000 ページを処理できます。
- ファイル サイズは 50 MB 未満にする必要があります。
- 画像の場合、寸法は 50 x 50 ~ 10,000 x 10,000 ピクセルである必要があります。
- .pdf ファイルの場合、サイズは最大 11 x 17 インチで、Legal または A3 の用紙サイズに対応し、小さくする必要があります。
- トレーニング データの合計サイズは 500 ページ以下です。
地球記号。 Multi-Geo 環境
Microsoft 365 Multi-Geo 環境で Syntex を設定する場合は、中央の場所でモデルの種類を使用するようにのみ構成できます。 サテライトの場所でこのモデルの種類を使用する場合は、Microsoft サポートにお問い合わせください。
オブジェクト シンボル。 マルチモデル ライブラリ
2 つ以上のトレーニング済みモデルが同じライブラリに適用されている場合、ファイルは、平均信頼度スコアが最も高いモデルを使用して分類されます。 抽出されたエンティティは、適用されたモデルからのみ取得されます。

領収書処理

アイコン 説明
ファイル シンボル。 サポートされているファイルの種類
このモデルでは、.bmp、.jpeg、.pdf、.png、.tiffのファイルの種類がサポートされています。
会話記号。 サポートされている言語
このモデルでは、英語、クロアチア語、チェコ語、デンマーク語、オランダ語、フィンランド語、ドイツ語、ハンガリー語、イタリア語、日本語、ラトビア語、リトアニア語、ノルウェー語、ポルトガル語、スペイン語、スウェーデン語、ベトナム語の領収書がサポートされています。
段落記号。 OCR に関する考慮事項
このモデルでは、光学式文字認識 (OCR) テクノロジを使用して、.pdf ファイル、イメージ ファイル、および.tiff ファイルをスキャンします。 OCR 処理は、次の要件を満たすドキュメントで最適に機能します。
- .jpg、.png、または .pdf のファイル形式 (テキストまたはスキャン)。 文字の抽出と場所にエラーが発生しないため、テキスト埋め込み .pdf ファイルの方が優れています。
- .pdf ファイルと.tiffファイルの場合、最大 2,000 ページを処理できます。
- ファイル サイズは 50 MB 未満にする必要があります。
- 画像の場合、寸法は 50 x 50 ~ 10,000 x 10,000 ピクセルである必要があります。
- .pdf ファイルの場合、サイズは最大 11 x 17 インチで、Legal または A3 の用紙サイズに対応し、小さくする必要があります。
- トレーニング データの合計サイズは 500 ページ以下です。
地球記号。 Multi-Geo 環境
Microsoft 365 Multi-Geo 環境で Syntex を設定する場合は、中央の場所でモデルの種類を使用するようにのみ構成できます。 サテライトの場所でこのモデルの種類を使用する場合は、Microsoft サポートにお問い合わせください。
オブジェクト シンボル。 マルチモデル ライブラリ
2 つ以上のトレーニング済みモデルが同じライブラリに適用されている場合、ファイルは、平均信頼度スコアが最も高いモデルを使用して分類されます。 抽出されたエンティティは、適用されたモデルからのみ取得されます。

機密情報の処理

アイコン 説明
ファイル シンボル。 サポートされているファイルの種類
このモデルでは、次のファイルの種類がサポートされています: .csv、 .doc、.docx、.eml、.heic、.heif、.htm、.html、.jpeg .jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls、.xlsx。
会話記号。 サポートされている言語
このモデルでは、次の言語がサポートされています。 サポートされている言語を参照してください。
このモデルでは、 手書きテキスト と印刷テキストの両方の言語もサポート されています
段落記号。 OCR に関する考慮事項
このモデルでは、光学式文字認識 (OCR) テクノロジを使用して、.pdf ファイル、イメージ ファイル、および.tiff ファイルをスキャンします。 OCR 処理は、次の要件を満たすドキュメントで最適に機能します。
- .jpg、.png、または .pdf のファイル形式 (テキストまたはスキャン)。 文字の抽出と場所にエラーが発生しないため、テキスト埋め込み .pdf ファイルの方が優れています。
- .pdf ファイルと.tiffファイルの場合、最大 2,000 ページを処理できます。
- ファイル サイズは 50 MB 未満にする必要があります。
- 画像の場合、寸法は 50 x 50 ~ 10,000 x 10,000 ピクセルである必要があります。
- .pdf ファイルの場合、サイズは最大 11 x 17 インチで、Legal または A3 の用紙サイズに対応し、小さくする必要があります。
- トレーニング データの合計サイズは 500 ページ以下です。
手書きテキストと印刷テキストの両方の言語をサポートします
地球記号。 Multi-Geo 環境
Microsoft 365 Multi-Geo 環境で Syntex を設定する場合は、中央の場所でモデルの種類を使用するようにのみ構成できます。 サテライトの場所でこのモデルの種類を使用する場合は、Microsoft サポートにお問い合わせください。
オブジェクト シンボル。 マルチモデル ライブラリ
2 つ以上のトレーニング済みモデルが同じライブラリに適用されている場合、ファイルは、平均信頼度スコアが最も高いモデルを使用して分類されます。 抽出されたエンティティは、適用されたモデルからのみ取得されます。

簡単なドキュメント処理

アイコン 説明
ファイル シンボル。 サポートされているファイルの種類
このモデルでは、.bmp、.jpeg、.pdf、.png、.tiffのファイルの種類がサポートされています。
会話記号。 サポートされている言語
このモデルでは、100 を超える言語のドキュメントがサポートされています。
段落記号。 OCR に関する考慮事項
このモデルでは、光学式文字認識 (OCR) テクノロジを使用して、.pdf ファイル、イメージ ファイル、および.tiff ファイルをスキャンします。 OCR 処理は、次の要件を満たすドキュメントで最適に機能します。
- .jpg、.png、または .pdf のファイル形式 (テキストまたはスキャン)。 文字の抽出と場所にエラーが発生しないため、テキスト埋め込み .pdf ファイルの方が優れています。
- .pdf ファイルと.tiffファイルの場合、最大 2,000 ページを処理できます。
- ファイル サイズは 50 MB 未満にする必要があります。
- 画像の場合、寸法は 50 x 50 ~ 10,000 x 10,000 ピクセルである必要があります。
- .pdf ファイルの場合、サイズは最大 11 x 17 インチで、Legal または A3 の用紙サイズに対応し、小さくする必要があります。
- トレーニング データの合計サイズは 500 ページ以下です。
地球記号。 Multi-Geo 環境
Microsoft 365 Multi-Geo 環境で Syntex を設定する場合は、中央の場所でモデルの種類を使用するようにのみ構成できます。 サテライトの場所でこのモデルの種類を使用する場合は、Microsoft サポートにお問い合わせください。
オブジェクト シンボル。 マルチモデル ライブラリ
2 つ以上のトレーニング済みモデルが同じライブラリに適用されている場合、ファイルは、平均信頼度スコアが最も高いモデルを使用して分類されます。 抽出されたエンティティは、適用されたモデルからのみ取得されます。