Partager via


Détection de langue Microsoft

Le service de détection de langue ELS est appelé Détection de langue Microsoft. Ce service utilise la technologie approuvée par Microsoft pour permettre aux applications de détecter la langue dans laquelle un texte spécifique est écrit.

Entrée dans la détection de langue Microsoft

L’entrée du service De détection de langue Microsoft est du texte UTF-16 (formulaire normalisé C). Le service doit déterminer la langue de ce texte.

Sortie de la détection de langue Microsoft

Le service Détection de langue Microsoft récupère des langues de liste de chaînes au format UTF-16 au format de registre double null, représentées par leurs noms, séparées par des délimiteurs de caractères Null. La liste est triée par pertinence. Pour la plupart des langues, les noms neutres sont utilisés. Toutefois, pour certains, par exemple, sr-Cyrl, sr-Latn, zh-Hant et zh-Hans, les noms complets sont utilisés.

Opération de détection de langue Microsoft

Le service Détection de langue Microsoft vérifie le script Unicode du texte fourni par l’application. Il segmente le texte en fonction des scripts qu’il détecte, puis détermine la langue dans laquelle chaque segment est écrit. Si un script indique une langue unique, la langue est garantie d’être présente dans la liste de sortie des langues. Le service utilise un algorithme breveté pour déterminer la pertinence de chaque langage pris en charge.

GUID de détection de langue Microsoft

Le GUID du service Microsoft Language Detection est déclaré dans Elssrvc.h, comme indiqué dans le code suivant.

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

à propos des services linguistiques étendus