API-referens för AI-textigenkänning (OCR) i Windows App SDK
Viktig
Tillgänglig i den senaste experimentella kanalen version av Windows App SDK.
Windows App SDK:s experimentella kanal innehåller API:er och funktioner i tidiga utvecklingsstadier. Alla API i den experimentella kanalen är föremål för omfattande revisioner och brytande ändringar och kan när som helst tas bort från efterföljande versioner. Experimentella funktioner stöds inte för användning i produktionsmiljöer och appar som använder dem kan inte publiceras till Microsoft Store.
- Fristående appar stöds inte.
Lär dig mer om Windows App SDK API:er, som stöds av artificiell intelligens (AI), som kan identifiera och extrahera text (tecken, ord, linjer, polygonala textgränser och konfidensnivåer för varje matchning) i bilder och konvertera den till maskinläsbara teckenströmmar.
Mer information finns i Komma igång med textigenkänning (OCR) i Windows App SDK.
Tips
Ge feedback om dessa API:er och deras funktioner genom att skapa ett nytt ärende i Windows App SDK:s GitHub-repo (inkludera OCR i rubriken) eller genom att svara på ett befintligt ärende.
Microsoft.Windows.Vision-namnrymd
Tillhandahåller API:er för maskininlärningsmodeller som analyserar textinnehållet i bilder.
DetectedLineStyle-enumerationstyp
public enum DetectedLineStyle
Anger de linjeformat som kan identifieras.
Fält
Handskriven: 0
Textraden är handskriven.
Övrigt: 1
Textraden är inte handskriven.
OrientationDetectionOptions-uppräkning
public enum OrientationDetectionOptions
Anger de textorienteringar som kan identifieras.
Fält
Ingen: 0
Orienteringen identifieras inte.
DetectOrientation: 1
Orientering erkänns.
RecognizedLine-klass
public sealed class RecognizedLine
Representerar en enda rad med igenkänd text.
RecognizedLine.Style-egenskapen
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
Hämtar det identifierade linjeformatet.
Egenskapsvärde
den erkända linjestilen.
Anmärkningar
Innehåller om textraden var handskriven eller inte och nivån på igenkänningsförtroendet.
Egenskap RecognizedLine.Text
public string Text { get; }
Hämtar texten på den identifierade raden.
Egenskapsvärde
Texten på den identifierade raden.
Anmärkningar
Alla ord sammanfogade med mellanslag.
RecognizedLine.Words-egenskapen
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
Orden på den identifierade raden.
Egenskapsvärde
Orden på den identifierade raden.
RecognizedLineStyle-struktur
public struct RecognizedLineStyle
Representerar stilen för den identifierade raden.
Fält
Självförtroende
Konfidensnivån för linjeformatigenkänningen.
Namn
Radformatets namn.
RecognizedText-klass
public sealed class RecognizedText
Representerar resultatet av en bild-till-text-igenkänningsåtgärd.
Egenskapen "RecognizedText.ImageAngle"
public float ImageAngle { get; }
Hämtar den identifierade textens rotationsvinkel medsols i grader.
Egenskapsvärde
Den identifierade textens rotationsvinkel medsols i grader.
Egenskapen för RecognizedText.Lines
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
Hämtar samlingen med identifierade rader.
Egenskapsvärde
Samlingen med identifierade rader.
RecognizedWord-klassen
public sealed class RecognizedWord
Representerar ett enda känt ord.
Egenskapen RecognizedWord.BoundingBox
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
Hämtar den fyrsidiga gränsen för det identifierade ordet.
Egenskapsvärde
Den fyrsidiga gränsen för det identifierade ordet. TopLeft är relativt ordets rotation.
Egenskapen RecognizedWord.Confidence
public float Confidence { get; }
Hämtar sannolikheten för att det här ordet igenkändes korrekt.
Egenskapsvärde
Wow sannolikt detta ord kändes igen korrekt. Värdet varierar från 0,0 till 1,0, inklusive.
Egenskapen RecognizedWord.Text
public string Text { get; }
Hämtar texten av det identifierade ordet.
Egenskapsvärde
Texten för det identifierade ordet.
TextRecognition.BoundingBox struct
public struct BoundingBox
En polygon med 4 punkter som används för gränsen för identifierade ord och textrader.
Fält
Nederst till vänster
Det nedre vänstra hörnet i avgränsningsrutan.
Nedre högra hörnet
Det nedre högra hörnet i avgränsningslådan.
Övre vänster
Den övre vänstra punkten i avgränsningsrutan.
TopRight
Avgränsningsrutans övre högra punkt.
Anmärkningar
När TopLeft, TopRight, BottomRightoch BottomLeft punkter returneras som en gräns för ett ord eller en rad, är de relativa till rotationen och skevheten hos den igenkända texten i bilden. Följande diagram visar punktlayouten för olika textrotationer där 0 är TopLeft, 1 är TopRight, 2 är BottomRightoch 3 är BottomLeft, allt i förhållande till texten.
TextRecognizer-klass
public sealed class TextRecognizer : System.IDisposable
Känner igen ord och linjer och deras fyrsidiga gränser i en källbild.
TextRecognizer.Close-metod
Gör sig av med objektet och associerade resurser.
Anmärkningar
Inte implementerad i C#.
TextRecognizer.CreateAsync-metod
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
Asynkront skapar en ny instans av klassen TextRecognizer.
Returnerar
En ny instans av klassen TextRecognizer.
Detta returnerar ett fel om GetModelReadyStatus inte är redo.
TextRecognizer.IsAvailable metod
public static bool IsAvailable ();
Hämtar info om den underliggande språkmodellen är installerad.
Returnerar
Sant om den underliggande språkmodellen är installerad. Annars falskt.
TextRecognizer.MakeAvailableAsync-metoden
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
Säkerställer att den underliggande språkmodellen är installerad och tillgänglig för användning.
Returnerar
En asynkron åtgärd med förlopp som returnerar en PackageDeploymentResult när den har slutförts.
TextRecognizer.RecognizeTextFromImage(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) metod
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Identifiera text i den angivna bilden.
Parametrar
bildbuffert
En okomprimerad bitmapp.
Alternativ
Alternativ för att konfigurera textigenkänningsmodellen för TextRecognizer.
Returnerar
Den igenkända texten.
TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Identifiera text asynkront i den angivna bilden.
Parametrar
bildbuffert
En okomprimerad bitmapp.
Alternativ
Alternativ för att konfigurera textigenkänningsmodellen för TextRecognizer.
Returnerar
Den igenkända texten.
TextRecognizerOptions-klass
public sealed class TextRecognizerOptions
Innehåller alternativ för att konfigurera textigenkänningsmodellen för en TextRecognizer.
TextRecognizerOptions.MaxAnalysisSize-egenskapen
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
Hämtar eller anger den maximala bildstorleken.
Egenskapsvärde
Den maximala bildstorleken. Standardvärdet är 1152 bredd och 768 höjd.
Anmärkningar
Den här storleken är ett förslag och kanske inte alltid respekteras.
Om källbilden är större än den maximala storleken skalas den automatiskt ned till de övre storleksgränserna.
Egenskapen MaxLineCount för TextRecognizerOptions
public uint MaxLineCount { get; set; }
Hämtar eller anger det maximala antalet rader som ska returneras från igenkänningsåtgärden.
Egenskapsvärde
Det maximala antalet rader som ska returneras från igenkänningsåtgärden.
Anmärkningar
Standardvärdet är MaxLineCountSupported. Om det anges kommer de maximala rader som returneras att vara mindre av det här värdet och MaxLineCountSupported.
TextRecognizerOptions.OrientationDetection-egenskapen
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
Hämtar eller anger om textorienteringen ska identifieras.
Egenskapsvärde
Om textorienteringen ska identifieras. Standardvärdet är Ingen.
TextRecognizerOptions.#ctor konstruktor
public TextRecognizerOptions ();
Initierar en ny instans av klassen TextRecognizerOptions.