डॉक्यूमेंट प्रोसेसिंग करने वाले मॉडल के लिए आवश्यकताएँ और सीमाएँ
समर्थित भाषाएँ
फिक्स्ड-टेम्प्लेट दस्तावेज़ों के लिए मॉडल
दस्तावेज़ प्रसंस्करण मॉडल को प्रशिक्षित करते समय और दस्तावेज़ प्रकार के रूप में फिक्स्ड-टेम्पलेट दस्तावेज़ का चयन करते समय निम्नलिखित भाषाओं का समर्थन किया जाता है:
अबाज़ा, अब्ख़ाज़ियन, अचीनीज़, अकोली, अडांगमे, अदिघे, अफ़ार, अफ़्रीकी, अकान, अल्बेनियन, अल्गोनक्विन, अंगिका (देवनागरी), अरबी, अस्तुरियन, असू (तंजानिया), अवेरिक, अवधी-हिंदी (देवनागरी), आयमारा, अज़रबैजानी (लैटिन), बफ़िया, बघेली, बाम्बारा, बश्किर, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), बेम्बा (ज़ाम्बिया), बेम्बा (ज़ाम्बिया), भोजपुरी-हिंदी (देवनागरी), बिकोल, बिनी, बिस्लामा, बोडो (देवनागरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुरात (सिरिलिक), कैटलन, सेबुआनो, चामलिंग, चमोरो, चेचन, छत्तीसगढ़ी (देवनागरी), चिगा, चीनी सरलीकृत, चीनी पारंपरिक, चोक्टाव, चुकोट, चुवाश, कोर्निश, कोर्सीकन, क्री, क्रीक, क्रीमियन तातार (लैटिन), क्रोएशियाई, क्रो, चेक, डेनिश, दरगवा, दारी, धीमल (देवनागरी), डोगरी (देवनागरी), दुआला, डुंगन, डच, इफिक, अंग्रेजी, एर्ज़्या (सिरिलिक), एस्टोनियाई, फिरोज़ी, फ़िजी, फिलिपिनो, फ़िनिश, फ़ॉन, फ्रेंच, फ़्रीयुलियन, गा, गागौज़ (लैटिन), गैलिशियन, गंदा, गायो, जर्मन, गिल्बर्ट, गोंडी (देवनागरी), ग्रीक, ग्रीनलैंडिक, गुआरानी, गुरुंग (देवनागरी), गुसी, हाईटियन क्रियोल, हल्बी (देवनागरी), हानी, हरियाणवी, हवाईयन, हिब्रू, हेरेरो, हिलिगेनन, हिंदी, हमोंग दाव (लैटिन), हो (देवनागिरी), हंगेरियन, इबान, आइसलैंडिक, इग्बो, इलोको, इनारी सामी, इंडोनेशियाई, इंगुश, इंटरलिंगुआ, इनुकीटूत (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनागरी), जावानीस, जोला-फोनी, कबार्डियन, काबुवेरदियानु, काचिन (लैटिन), कालेंजिन, कलमीक, कांगड़ी (देवनागरी), कनूरी, कराचाय-बलकार, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कजाख (सिरिलिक), कजाख (लैटिन), खाकास, खालिंग, खासी, के'इचे', किकुयू, किल्डिन सामी, किन्यारवांडा, कोमी, कोंगो, कोरियाई, कोरकू, कोर्याक्स, कोसरैन, केपेल, कुआन्यामा, कुम्यक (सिरिलिक), कुर्दिश (अरबी), कुर्दिश (लैटिन), कुरुख (देवनागरी), किर्गिज़ (सिरिलिक), लाक, लकोटा, लैटिन, लातवियाई, लेज़्घीयन, लिंगाला, लिथुआनियाई, निचला सोरबियन, लोज़ी, लूले सामी, लुओ (केन्या और तंजानिया), लक्जमबर्गिश, लुइया लुय, मैसेडोनियन, माचामे, मादुरीस, महासू पहाड़ी (देवनागरी), मखुवा-मीट्टो, माकोंडे, मालागासी, मलय (लैटिन), माल्टीज़, माल्टो (देवनागरी), मंडिन्का, मैक्स, माओरी, मापुदुंगुन, मराठी, मारी (रूस), मसाई, मेंडे (सिएरा लियोन), मेरु, मेटा', मिनांगकाबाउ, मोहौक, मंगोलियन (सिरिलिक), मोंगोन्डो, मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), मोरीस्येन, मुंडांग, नाहुआट्ल, नवाजो, एनडोंगा, नेपल्स, नेपाली, न्गोम्बा, नियुआन, नोगे, उत्तर नेबेले, उत्तर सामी (लैटिन), नॉर्वेजियन, न्यांजा, न्यांकोले, न्जिमा, ओसीटान, ओजिब्वा, ओरोमो, ओस्सेटिक, पंपंगा, पंगासिनन, पापियामेन्टो, पश्तो, पेडी, फ़ारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), क्वेशुआ, रिपुरियन, रोमानियाई, रोमांश, रुंडी, रूसी, रवा, सादरी (देवनागरी), साखा, सम्बुरु, समोअन (लैटिन), सांगो, संगु (गैबॉन), संस्कृत (देवनागरी), संथाली(देवनागिरी), स्कॉट्स, स्कॉटिश गेलिक, सेना, सर्बियाई (सिरिलिक), सर्बियाई (लैटिन), शम्बाला, शेरपा (देवनागरी), शोना, सिक्सिका, सिरमौरी (देवनागरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोगा, सोमाली (अरबी), सोमाली (लैटिन), सोंगई, दक्षिण नेबेले, दक्षिणी अल्ताई, दक्षिणी सामी, दक्षिणी सोथो, स्पेनिश, सुंडानी, स्वाहिली (लैटिन), स्वाती, स्वीडिश, तबस्सरन, तचेलहिट, ताहितियन, ताइता, ताजिक (सिरिलिक), तमिल, तातार (सिरिलिक), तातार (लैटिन), टेसो, तेतुम, थाई, थांगमी, टोक पिसिन, टोंगन, त्सोंगा, त्सवाना, तुर्की, तुर्कमेन (लैटिन), तुवन, उदमुर्त, उइघुर (सिरिलिक), यूक्रेनी, ऊपरी सोरबियन, उर्दू, उइघुर (अरबी), उज्बेक (अरबी), उज्बेक (सिरिलिक), उज्बेक (लैटिन), वियतनामी, वोलापुक, वुन्जो, वाल्सर, वेल्श, पश्चिमी फ़्रिसियाई, वोलोफ़, ज़ोसा, युकाटेक माया, ज़ापोटेक, ज़र्मा, झुआंग, ज़ुलु
सामान्य दस्तावेजों के लिए मॉडल
दस्तावेज़ प्रसंस्करण मॉडल को प्रशिक्षित करते समय और दस्तावेज़ प्रकार के रूप में सामान्य दस्तावेज़ का चयन करते समय निम्नलिखित भाषाओं का समर्थन किया जाता है।
अफ़्रीकी, अल्बेनियन, अरबी, बल्गेरियाई, चीनी (हान (सरलीकृत संस्करण)), चीनी (हान (पारंपरिक संस्करण)), क्रोएशियाई, चेक, डेनिश, डच, एस्टोनियाई, फ़िनिश, फ़्रेंच, जर्मन, हिब्रू, हिंदी, हंगेरियन, इंडोनेशियाई, इतालवी, जापानी, कोरियाई, लातवियाई, लिथुआनियाई, मैसेडोनियन, मराठी, आधुनिक ग्रीक (1453-), नेपाली (मैक्रोलैंग्वेज), नॉर्वेजियन, पंजाबी, फ़ारसी, पोलिश, पुर्तगाली, रोमानियाई, रूसी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), सोमाली (लैटिन), स्पेनिश, स्वाहिली (मैक्रोलैंग्वेज), स्वीडिश, तमिल, थाई, तुर्की, यूक्रेनी, उर्दू, वियतनामी
आवश्यकताएँ
दस्तावेज़ प्रसंस्करण उन इनपुट दस्तावेज़ों पर काम करता है जो निम्नलिखित आवश्यकताओं को पूरा करते हैं:
- JPG, PNG, या PDF प्रारूप (पाठ या स्कैन किया हुआ)। टेक्स्ट-एम्बेडेड पीडीएफ बेहतर होते हैं, क्योंकि उनमें अक्षर निष्कर्षण और स्थान निर्धारण में कोई त्रुटि नहीं होगी।
- TIFF फ़ाइलों का उपयोग प्रशिक्षण के लिए नहीं किया जा सकता। मॉडल को प्रशिक्षित करने के लिए आपको PDF, JPG या PNG प्रारूप में दस्तावेज़ों का उपयोग करना होगा। एक बार मॉडल को प्रशिक्षित कर दिए जाने के बाद, जब मॉडल को क्लाउड प्रवाह में उपयोग किया जाता है, तो यह TIFF फ़ाइलों से डेटा निकाल सकता है। Power Automate
- यदि आपकी पीडीएफ फाइल पासवर्ड से लॉक है, तो आपको उन्हें सबमिट करने से पहले लॉक हटाना होगा।
- प्रक्रिया हेतु अधिकतम दस्तावेज़ का आकार 20 एमबी से अधिक नहीं होना चाहिए।
- छवियों के लिए आयाम 50 × 50 और 10,000 × 10,000 पिक्सेल के बीच होना चाहिए।
- यदि कागजी दस्तावेजों से स्कैन किया जाए तो स्कैन की गई छवियां उच्च गुणवत्ता वाली होनी चाहिए।
- आप प्रति मॉडल 200 तक संग्रह बना सकते हैं।
- क्लाउड फ्लो में, दस्तावेज़ प्रसंस्करण के लिए टैग किए जा सकने वाले फ़ील्ड की सीमा 300 है।
नोट
- दस्तावेज़ों से हस्ताक्षर निकालना वर्तमान में समर्थित नहीं है.
- पृष्ठ सीमाओं में विभाजित फ़ील्ड वर्तमान में समर्थित नहीं हैं.
- एक पृष्ठ से दूसरे पृष्ठ पर विभाजित होने वाली पंक्तियाँ वर्तमान में समर्थित नहीं हैं.
अनुकूलन टिप
दस्तावेज़ प्रसंस्करण मॉडल के प्रदर्शन को बेहतर बनाने का तरीका जानें।