Dela via


API-referens för AI-textigenkänning (OCR) i Windows App SDK

Viktig

Tillgänglig i den senaste experimentella kanalen version av Windows App SDK.

Windows App SDK:s experimentella kanal innehåller API:er och funktioner i tidiga utvecklingsstadier. Alla API i den experimentella kanalen är föremål för omfattande revisioner och brytande ändringar och kan när som helst tas bort från efterföljande versioner. Experimentella funktioner stöds inte för användning i produktionsmiljöer och appar som använder dem kan inte publiceras till Microsoft Store.

  • Fristående appar stöds inte.

Lär dig mer om Windows App SDK API:er, som stöds av artificiell intelligens (AI), som kan identifiera och extrahera text (tecken, ord, linjer, polygonala textgränser och konfidensnivåer för varje matchning) i bilder och konvertera den till maskinläsbara teckenströmmar.

Mer information finns i Komma igång med textigenkänning (OCR) i Windows App SDK.

Tips

Ge feedback om dessa API:er och deras funktioner genom att skapa ett nytt ärende i Windows App SDK:s GitHub-repo (inkludera OCR i rubriken) eller genom att svara på ett befintligt ärende.


Microsoft.Windows.Vision-namnrymd

Tillhandahåller API:er för maskininlärningsmodeller som analyserar textinnehållet i bilder.

DetectedLineStyle-enumerationstyp

public enum DetectedLineStyle

Anger de linjeformat som kan identifieras.

Fält

Handskriven: 0

Textraden är handskriven.

Övrigt: 1

Textraden är inte handskriven.

OrientationDetectionOptions-uppräkning

public enum OrientationDetectionOptions

Anger de textorienteringar som kan identifieras.

Fält

Ingen: 0

Orienteringen identifieras inte.

DetectOrientation: 1

Orientering erkänns.

RecognizedLine-klass

public sealed class RecognizedLine

Representerar en enda rad med igenkänd text.

RecognizedLine.Style-egenskapen

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Hämtar det identifierade linjeformatet.

Egenskapsvärde

den erkända linjestilen.

Anmärkningar

Innehåller om textraden var handskriven eller inte och nivån på igenkänningsförtroendet.

Egenskap RecognizedLine.Text

public string Text { get; }

Hämtar texten på den identifierade raden.

Egenskapsvärde

Texten på den identifierade raden.

Anmärkningar

Alla ord sammanfogade med mellanslag.

RecognizedLine.Words-egenskapen

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Orden på den identifierade raden.

Egenskapsvärde

Orden på den identifierade raden.

RecognizedLineStyle-struktur

public struct RecognizedLineStyle

Representerar stilen för den identifierade raden.

Fält

Självförtroende

Konfidensnivån för linjeformatigenkänningen.

Namn

Radformatets namn.

RecognizedText-klass

public sealed class RecognizedText

Representerar resultatet av en bild-till-text-igenkänningsåtgärd.

Egenskapen "RecognizedText.ImageAngle"

public float ImageAngle { get; }

Hämtar den identifierade textens rotationsvinkel medsols i grader.

Egenskapsvärde

Den identifierade textens rotationsvinkel medsols i grader.

Egenskapen för RecognizedText.Lines

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Hämtar samlingen med identifierade rader.

Egenskapsvärde

Samlingen med identifierade rader.

RecognizedWord-klassen

public sealed class RecognizedWord

Representerar ett enda känt ord.

Egenskapen RecognizedWord.BoundingBox

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Hämtar den fyrsidiga gränsen för det identifierade ordet.

Egenskapsvärde

Den fyrsidiga gränsen för det identifierade ordet. TopLeft är relativt ordets rotation.

Egenskapen RecognizedWord.Confidence

public float Confidence { get; }

Hämtar sannolikheten för att det här ordet igenkändes korrekt.

Egenskapsvärde

Wow sannolikt detta ord kändes igen korrekt. Värdet varierar från 0,0 till 1,0, inklusive.

Egenskapen RecognizedWord.Text

public string Text { get; }

Hämtar texten av det identifierade ordet.

Egenskapsvärde

Texten för det identifierade ordet.

TextRecognition.BoundingBox struct

public struct BoundingBox

En polygon med 4 punkter som används för gränsen för identifierade ord och textrader.

Fält

Nederst till vänster

Det nedre vänstra hörnet i avgränsningsrutan.

Nedre högra hörnet

Det nedre högra hörnet i avgränsningslådan.

Övre vänster

Den övre vänstra punkten i avgränsningsrutan.

TopRight

Avgränsningsrutans övre högra punkt.

Anmärkningar

När TopLeft, TopRight, BottomRightoch BottomLeft punkter returneras som en gräns för ett ord eller en rad, är de relativa till rotationen och skevheten hos den igenkända texten i bilden. Följande diagram visar punktlayouten för olika textrotationer där 0 är TopLeft, 1 är TopRight, 2 är BottomRightoch 3 är BottomLeft, allt i förhållande till texten.

Diagram över tre exempel på avgränsningsrutor som visar hur hörnpunkter identifieras baserat på textrotation.

TextRecognizer-klass

public sealed class TextRecognizer : System.IDisposable

Känner igen ord och linjer och deras fyrsidiga gränser i en källbild.

TextRecognizer.Close-metod

Gör sig av med objektet och associerade resurser.

Anmärkningar

Inte implementerad i C#.

TextRecognizer.CreateAsync-metod

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Asynkront skapar en ny instans av klassen TextRecognizer.

Returnerar

En ny instans av klassen TextRecognizer.

Detta returnerar ett fel om GetModelReadyStatus inte är redo.

TextRecognizer.IsAvailable metod

public static bool IsAvailable ();

Hämtar info om den underliggande språkmodellen är installerad.

Returnerar

Sant om den underliggande språkmodellen är installerad. Annars falskt.

TextRecognizer.MakeAvailableAsync-metoden

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Säkerställer att den underliggande språkmodellen är installerad och tillgänglig för användning.

Returnerar

En asynkron åtgärd med förlopp som returnerar en PackageDeploymentResult när den har slutförts.

TextRecognizer.RecognizeTextFromImage(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) metod

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Identifiera text i den angivna bilden.

Parametrar
bildbuffert

En okomprimerad bitmapp.

Alternativ

Alternativ för att konfigurera textigenkänningsmodellen för TextRecognizer.

Returnerar

Den igenkända texten.

TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Identifiera text asynkront i den angivna bilden.

Parametrar
bildbuffert

En okomprimerad bitmapp.

Alternativ

Alternativ för att konfigurera textigenkänningsmodellen för TextRecognizer.

Returnerar

Den igenkända texten.

TextRecognizerOptions-klass

public sealed class TextRecognizerOptions

Innehåller alternativ för att konfigurera textigenkänningsmodellen för en TextRecognizer.

TextRecognizerOptions.MaxAnalysisSize-egenskapen

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Hämtar eller anger den maximala bildstorleken.

Egenskapsvärde

Den maximala bildstorleken. Standardvärdet är 1152 bredd och 768 höjd.

Anmärkningar

Den här storleken är ett förslag och kanske inte alltid respekteras.

Om källbilden är större än den maximala storleken skalas den automatiskt ned till de övre storleksgränserna.

Egenskapen MaxLineCount för TextRecognizerOptions

public uint MaxLineCount { get; set; }

Hämtar eller anger det maximala antalet rader som ska returneras från igenkänningsåtgärden.

Egenskapsvärde

Det maximala antalet rader som ska returneras från igenkänningsåtgärden.

Anmärkningar

Standardvärdet är MaxLineCountSupported. Om det anges kommer de maximala rader som returneras att vara mindre av det här värdet och MaxLineCountSupported.

TextRecognizerOptions.OrientationDetection-egenskapen

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Hämtar eller anger om textorienteringen ska identifieras.

Egenskapsvärde

Om textorienteringen ska identifieras. Standardvärdet är Ingen.

TextRecognizerOptions.#ctor konstruktor

public TextRecognizerOptions ();

Initierar en ny instans av klassen TextRecognizerOptions.