Aracılığıyla paylaş


Windows Uygulama SDK'sında Yapay Zeka Metin Tanıma (OCR) için API başvurusu

Önemli

Windows Uygulama SDK'sının en son deneysel kanal sürümünde kullanılabilir.

Windows Uygulama SDK'sı deneysel kanalı, geliştirmenin erken aşamalarında API'leri ve özellikleri içerir. Deneysel kanaldaki tüm API'ler kapsamlı düzeltmelere ve hataya neden olan değişikliklere tabidir ve herhangi bir zamanda sonraki sürümlerden kaldırılabilir. Deneysel özellikler üretim ortamlarında kullanılmak üzere desteklenmez ve bunları kullanan uygulamalar Microsoft Store'da yayımlanamaz.

  • Bağımsız uygulamalar desteklenmez.

Görüntülerdeki metinleri (karakterler, sözcükler, çizgiler, çokgen metin sınırları ve güvenilirlik düzeyleri) algılayıp ayıklayıp makine tarafından okunabilir karakter akışlarına dönüştürebilen yapay zeka (AI) destekli Windows Uygulama SDK'sı API'leri hakkında bilgi edinin.

Daha fazla ayrıntı için windows uygulama SDK'sımetin tanımayı (OCR) kullanmaya başlama bölümüne bakın.

Bahşiş

Windows Uygulama SDK'sı GitHub deposunda (başlıkta OCR dahil) yeni bir konu oluşturarak veya mevcut birkonuya yanıt vererek bu API'ler ve işlevleri hakkında geri bildirimde bulunun.


Microsoft.Windows.Vision ad alanı

Görüntülerin metin içeriğini analiz eden makine öğrenmesi modelleri için API'ler sağlar.

DetectedLineStyle sabit listesi

public enum DetectedLineStyle

Tanınabilecek çizgi stillerini belirtir.

Alanları

El yazısı: 0

Metin satırı el ile yazılır.

Diğer: 1

Metin satırı el ile yazılmaz.

OrientationDetectionOptions sabit listesi

public enum OrientationDetectionOptions

Tanınabilecek metin yönlendirmelerini belirtir.

Alanları

Yok: 0

Yön tanınmıyor.

DetectOrientation: 1

Oryantasyon tanınmıştır.

RecognizedLine sınıfı

public sealed class RecognizedLine

Tanınan metnin tek bir satırını temsil eder.

RecognizedLine.Style özelliği

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Tanınan çizgi stilini elde eder.

Özellik değeri

tanınan çizgi stili.

Açıklamalar

Metin satırının el yazısıyla yazılıp yazılmadığını ve tanıma güvenilirliği düzeyini içerir.

RecognizedLine.Text özelliği

public string Text { get; }

Tanınan satırın metnini alır.

Özellik değeri

Tanınmış satırın metni.

Açıklamalar

Tüm sözcükler boşluklarla birleştirilir.

RecognizedLine.Words özelliği

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Tanınan satırdaki sözcükler.

Özellik değeri

Tanınan satırdaki sözcükler.

RecognizedLineStyle yapısı

public struct RecognizedLineStyle

Tanınan çizginin stilini temsil eder.

Alanları

Güven

Çizgi stili tanımanın güvenilirlik düzeyi.

İsim

Çizgi stili adı.

RecognizedText sınıfı

public sealed class RecognizedText

Görüntüden metne tanıma işleminin sonucunu temsil eder.

RecognizedText.ImageAngle özelliği

public float ImageAngle { get; }

Tanınan metnin saat yönünde dönüş açısını derece cinsinden alır.

Özellik değeri

Tanınan metnin derece cinsinden saat yönünde döndürme açısı.

RecognizedText.Lines özelliği

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Tanınan satırların koleksiyonunu alır.

Özellik değeri

Tanınan satırların koleksiyonu.

RecognizedWord sınıfı

public sealed class RecognizedWord

Tek bir tanınan sözcüğü temsil eder.

RecognizedWord.BoundingBox özelliği

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Algılanan sözcüğün dikdörtgen sınırını alır.

Özellik değeri

Tanınan sözcüğün dörtgen sınırı. TopLeft sözcüğün dönüşüne göredir.

RecognizedWord.Confidence özelliği

public float Confidence { get; }

Bu sözcüğün doğru tanınma olasılığını alır.

Özellik değeri

Vay, büyük olasılıkla bu kelime doğru tanındı. Değer 0,0 ile 1,0 (dahil) arasında değişir.

RecognizedWord.Text özelliği

public string Text { get; }

Tanınan sözcüğün metnini alır.

Özellik değeri

Tanınan sözcüğün metni.

TextRecognition.BoundingBox yapısı

public struct BoundingBox

Tanınan sözcüklerin ve metin satırlarının sınırı için kullanılan 4 noktalı çokgen.

Alanları

Sol Alt

Sınırlayıcı kutunun sol alt köşesi.

Alt Sağ

Sınırlayıcı kutunun sağ alt köşesi.

Sol Üst

Sınırlayıcı kutunun sol üst noktası.

TopRight

Sınırlayıcı kutunun sağ üst noktası.

Açıklamalar

Bir kelime veya satır için bir sınır olarak döndürülürse, TopLeft, TopRight, BottomRightve BottomLeft noktaları, görüntüdeki tanımlanan yazının dönme ve çarpıklığına göre belirlenir. Aşağıdaki diyagramda, farklı metin döndürmeleri için metne göre nokta düzeni gösterilmektedir; 0 için TopLeft, 1 için TopRight, 2 için BottomRightve 3 için BottomLeftolarak belirlenmiştir.

Köşe noktalarının metin döndürmeye göre nasıl tanımlandığını gösteren üç sınır kutusu örneğinin diyagramı.

TextRecognizer sınıfı

public sealed class TextRecognizer : System.IDisposable

Kaynak görüntüde sözcükleri ve çizgileri ve bunların dörtgen sınırlarını tanır.

TextRecognizer.Close yöntemi

Nesneyi ve ilişkili kaynakları imha eder.

Açıklamalar

C# dilinde uygulanmadı.

TextRecognizer.CreateAsync yöntemi

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

TextRecognizer sınıfının yeni bir örneğini zaman uyumsuz olarak oluşturur.

İadeler

TextRecognizer sınıfının yeni bir örneği.

GetModelReadyStatus Hazır değilse bu hata döndürür.

TextRecognizer.IsAvailable yöntemi

public static bool IsAvailable ();

Temel alınan dil modelinin yüklü olup olmadığını kontrol eder.

İadeler

Temel alınan dil modeli yüklüyse doğru. Aksi takdirde yanlış.

TextRecognizer.MakeAvailableAsync yöntemi

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Altta yatan dil modelinin yüklü olduğundan ve kullanılabilir durumda olduğundan emin olun.

İadeler

Tamamlandığında PackageDeploymentResult döndüren, ilerleme durumuna sahip zaman uyumsuz bir eylem.

TextRecognizer.RecognizeTextFromImage(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) yöntemi

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Sağlanan görüntüdeki metni tanıma.

Parametreler
imageBuffer

Sıkıştırılmamış bitmap.

Seçenekler

TextRecognizer için metin tanıma modelini yapılandırma seçenekleri.

İadeler

Tanınan metin.

TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) yöntemi

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Sağlanan görüntüdeki metni zaman uyumsuz olarak tanıyın.

Parametreler
imageBuffer

Sıkıştırılmamış bitmap.

Seçenekler

TextRecognizer için metin tanıma modelini yapılandırma seçenekleri.

İadeler

Tanınan metin.

TextRecognizerOptions sınıfı

public sealed class TextRecognizerOptions

TextRecognizer için metin tanıma modelini yapılandırma seçenekleri sağlar.

TextRecognizerOptions.MaxAnalysisSize özelliği

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

En büyük görüntü boyutunu alır veya ayarlar.

Özellik değeri

En büyük görüntü boyutu. Varsayılan değer 1152 genişlik ve 768 yüksekliktir.

Açıklamalar

Bu boyut bir öneridir ve her zaman kabul edilmeyebilir.

Kaynak görüntü boyut üst sınırından büyükse, otomatik olarak üst boyut sınırlarına ölçeklendirilir.

TextRecognizerOptions.MaxLineCount özelliği

public uint MaxLineCount { get; set; }

Tanıma işleminden döndürülecek en fazla satır sayısını alır veya ayarlar.

Özellik değeri

Tanıma işleminden döndürülecek en fazla satır sayısı.

Açıklamalar

Varsayılan olarak MaxLineCountSupported ayarlanır. Belirtilirse, döndürülen maksimum satır sayısı bu değer ile MaxLineCountSupported değerinden daha küçük olanı olacaktır.

TextRecognizerOptions.OrientationDetection özelliği

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Metin yönlendirmesinin algılanıp algılamayacağını alır veya ayarlar.

Özellik değeri

Metin yönünün algılanıp algılanmayacağı. Varsayılan değer Yok'tır.

TextRecognizerOptions.#ctor oluşturucu

public TextRecognizerOptions ();

TextRecognizerOptions sınıfının yeni bir örneğini başlatır.