Taaldetectie van Microsoft
De ELS-taaldetectieservice wordt Microsoft Language Detection genoemd. Deze service maakt gebruik van door Microsoft gepatenteerde technologie, zodat toepassingen de taal kunnen detecteren waarin specifieke tekst wordt geschreven.
Invoer voor Microsoft-taaldetectie
De invoer voor de Microsoft Language Detection-service is UTF-16 -tekst (genormaliseerde vorm C). De service moet de taal voor deze tekst bepalen.
Uitvoer van Microsoft Language Detection
De Microsoft Language Detection-service haalt een door het register opgemaakte UTF-16-tekenreeks op die talen bevat die door hun namen worden vertegenwoordigd, gescheiden door scheidingstekens met null-tekens. De lijst wordt gesorteerd op relevantie. Voor de meeste talen worden neutrale namen gebruikt. Voor sommigen, bijvoorbeeld sr-Cyrl, sr-Latn, zh-Hant en zh-Hans, worden volledige namen gebruikt.
Bewerking voor taaldetectie van Microsoft
De Microsoft Language Detection-service controleert het Unicode-script van de tekst die door de toepassing wordt geleverd. Deze segmenteert de tekst op basis van de scripts die worden gedetecteerd en bepaalt vervolgens de taal waarin elk segment wordt geschreven. Als een script één taal aangeeft, is de taal gegarandeerd aanwezig in de uitvoerlijst met talen. De service maakt gebruik van een gepatenteerd algoritme om de relevantie van elke ondersteunde taal te bepalen.
GUID voor Taaldetectie van Microsoft
De GUID voor de Microsoft Language Detection-service wordt gedeclareerd in Elssrvc.h, zoals wordt weergegeven in de volgende code.
// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
{ 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };
Verwante onderwerpen