Indexes - Analyze
Azt mutatja be, hogy egy elemző hogyan töri fel a szöveget jogkivonatokra.
POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2024-07-01
URI-paraméterek
Name | In | Kötelező | Típus | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
A keresési szolgáltatás végponti URL-címe. |
index
|
path | True |
string |
Annak az indexnek a neve, amelynek az elemzőt tesztelnie kell. |
api-version
|
query | True |
string |
Ügyfél API-verziója. |
Kérelem fejléce
Name | Kötelező | Típus | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben. |
Kérelem törzse
Name | Kötelező | Típus | Description |
---|---|---|---|
text | True |
string |
A jogkivonatokra törni kívánt szöveg. |
analyzer |
A megadott szöveg megszakításához használandó elemző neve. Ha ez a paraméter nincs megadva, ehelyett tokenizert kell megadnia. A tokenizer és az elemző paraméterei kölcsönösen kizárják egymást. |
||
charFilters |
A megadott szöveg feltörésekor használandó karakterszűrők választható listája. Ez a paraméter csak a tokenizer paraméter használatakor állítható be. |
||
tokenFilters |
A megadott szöveg feltörésekor használandó jogkivonatszűrők opcionális listája. Ez a paraméter csak a tokenizer paraméter használatakor állítható be. |
||
tokenizer |
A jogkivonat-szabályzó neve, amely a megadott szöveg megszakításához használható. Ha ez a paraméter nincs megadva, ehelyett egy elemzőt kell megadnia. A tokenizer és az elemző paraméterei kölcsönösen kizárják egymást. |
Válaszok
Name | Típus | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Hibaválasz. |
Példák
SearchServiceIndexAnalyze
Mintakérelem
POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2024-07-01
{
"text": "Text to analyze",
"analyzer": "standard.lucene"
}
Mintaválasz
{
"tokens": [
{
"token": "text",
"startOffset": 0,
"endOffset": 4,
"position": 0
},
{
"token": "to",
"startOffset": 5,
"endOffset": 7,
"position": 1
},
{
"token": "analyze",
"startOffset": 8,
"endOffset": 15,
"position": 2
}
]
}
Definíciók
Name | Description |
---|---|
Analyzed |
Információ egy elemző által visszaadott jogkivonatról. |
Analyze |
A szöveg jogkivonatokra való feltöréséhez használt szöveg- és elemzési összetevőket adja meg. |
Analyze |
Az elemző szövegen való tesztelésének eredménye. |
Char |
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét. |
Error |
Az erőforrás-kezelési hiba további információi. |
Error |
A hiba részletei. |
Error |
Hibaválasz |
Lexical |
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét. |
Lexical |
Meghatározza a keresőmotor által támogatott összes tokenizer nevét. |
Token |
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét. |
AnalyzedTokenInfo
Információ egy elemző által visszaadott jogkivonatról.
Name | Típus | Description |
---|---|---|
endOffset |
integer |
A jogkivonat utolsó karakterének indexe a bemeneti szövegben. |
position |
integer |
A jogkivonat pozíciója a bemeneti szövegben más jogkivonatokhoz képest. A bemeneti szöveg első tokenje 0, a következő pedig az 1. pozícióval rendelkezik, és így tovább. A használt elemzőtől függően előfordulhat, hogy egyes jogkivonatok azonos helyzetben vannak, például ha egymással szinonimák. |
startOffset |
integer |
A jogkivonat első karakterének indexe a bemeneti szövegben. |
token |
string |
Az elemző által visszaadott jogkivonat. |
AnalyzeRequest
A szöveg jogkivonatokra való feltöréséhez használt szöveg- és elemzési összetevőket adja meg.
Name | Típus | Description |
---|---|---|
analyzer |
A megadott szöveg megszakításához használandó elemző neve. Ha ez a paraméter nincs megadva, ehelyett tokenizert kell megadnia. A tokenizer és az elemző paraméterei kölcsönösen kizárják egymást. |
|
charFilters |
A megadott szöveg feltörésekor használandó karakterszűrők választható listája. Ez a paraméter csak a tokenizer paraméter használatakor állítható be. |
|
text |
string |
A jogkivonatokra törni kívánt szöveg. |
tokenFilters |
A megadott szöveg feltörésekor használandó jogkivonatszűrők opcionális listája. Ez a paraméter csak a tokenizer paraméter használatakor állítható be. |
|
tokenizer |
A jogkivonat-szabályzó neve, amely a megadott szöveg megszakításához használható. Ha ez a paraméter nincs megadva, ehelyett egy elemzőt kell megadnia. A tokenizer és az elemző paraméterei kölcsönösen kizárják egymást. |
AnalyzeResult
Az elemző szövegen való tesztelésének eredménye.
Name | Típus | Description |
---|---|---|
tokens |
A kérelemben megadott elemző által visszaadott jogkivonatok listája. |
CharFilterName
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.
Name | Típus | Description |
---|---|---|
html_strip |
string |
Egy karakterszűrő, amely megpróbálja kiszűrni a HTML-szerkezeteket. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
ErrorAdditionalInfo
Az erőforrás-kezelési hiba további információi.
Name | Típus | Description |
---|---|---|
info |
object |
A további információk. |
type |
string |
A további információtípus. |
ErrorDetail
A hiba részletei.
Name | Típus | Description |
---|---|---|
additionalInfo |
A hiba további információi. |
|
code |
string |
A hibakód. |
details |
A hiba részletei. |
|
message |
string |
A hibaüzenet. |
target |
string |
A hibacél. |
ErrorResponse
Hibaválasz
Name | Típus | Description |
---|---|---|
error |
A hibaobjektum. |
LexicalAnalyzerName
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.
Name | Típus | Description |
---|---|---|
ar.lucene |
string |
Lucene elemző arabhoz. |
ar.microsoft |
string |
Microsoft analyzer for Arab. |
bg.lucene |
string |
Lucene elemző bolgárnak. |
bg.microsoft |
string |
Microsoft analyzer for Bolgár. |
bn.microsoft |
string |
A Bangla Microsoft-elemzője. |
ca.lucene |
string |
Lucene elemző katalánnak. |
ca.microsoft |
string |
A Katalán Microsoft elemzője. |
cs.lucene |
string |
Lucene elemző csehnek. |
cs.microsoft |
string |
Microsoft analyzer for Czech. |
da.lucene |
string |
Lucene elemző dánnak. |
da.microsoft |
string |
Microsoft analyzer dán nyelven. |
de.lucene |
string |
Lucene elemző németnek. |
de.microsoft |
string |
Microsoft analyzer for German. |
el.lucene |
string |
Lucene elemző görögnek. |
el.microsoft |
string |
Microsoft analyzer for Greek. |
en.lucene |
string |
Lucene elemző angolul. |
en.microsoft |
string |
Microsoft analyzer for English. |
es.lucene |
string |
Lucene elemző spanyolnak. |
es.microsoft |
string |
Microsoft analyzer for Spanyol. |
et.microsoft |
string |
Microsoft analyzer az észtekhez. |
eu.lucene |
string |
Lucene elemző baszknak. |
fa.lucene |
string |
Lucene elemző perzsa. |
fi.lucene |
string |
Lucene elemző finnnek. |
fi.microsoft |
string |
Microsoft analyzer for Finn. |
fr.lucene |
string |
Lucene elemző franciának. |
fr.microsoft |
string |
Microsoft analyzer for French. |
ga.lucene |
string |
Lucene elemző írnek. |
gl.lucene |
string |
Lucene elemző galíciainak. |
gu.microsoft |
string |
Microsoft analyzer for Gujarati. |
he.microsoft |
string |
Microsoft analyzer for Héber. |
hi.lucene |
string |
Lucene elemző hindinek. |
hi.microsoft |
string |
Microsoft analyzer for Hindi. |
hr.microsoft |
string |
Microsoft analyzer for Horvát. |
hu.lucene |
string |
Lucene elemző magyarnak. |
hu.microsoft |
string |
Microsoft analyzer for Hungarian. |
hy.lucene |
string |
Lucene elemző örménynek. |
id.lucene |
string |
Lucene elemző indonéznek. |
id.microsoft |
string |
Indonéz Microsoft-elemző (Bahasa). |
is.microsoft |
string |
A Microsoft izlandi elemzője. |
it.lucene |
string |
Lucene elemző olasznak. |
it.microsoft |
string |
Microsoft analyzer for Italian. |
ja.lucene |
string |
Lucene elemző japánnak. |
ja.microsoft |
string |
Microsoft Analyzer japánhoz. |
keyword |
string |
Egy mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és néhány terméknév. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
A Kannada Microsoft-elemzője. |
ko.lucene |
string |
Lucene elemző koreainak. |
ko.microsoft |
string |
Microsoft-elemző koreaihoz. |
lt.microsoft |
string |
Microsoft-elemző litvánhoz. |
lv.lucene |
string |
Lucene elemző lettnek. |
lv.microsoft |
string |
Microsoft analyzer for Lett. |
ml.microsoft |
string |
Microsoft-elemző malajalamhoz. |
mr.microsoft |
string |
Marathi Microsoft-elemzője. |
ms.microsoft |
string |
Microsoft Analyzer for Maly (latin). |
nb.microsoft |
string |
Microsoft analyzer for Norwegian (Bokmål). |
nl.lucene |
string |
Lucene elemző hollandnak. |
nl.microsoft |
string |
Microsoft analyzer for Holland. |
no.lucene |
string |
Lucene elemző norvégnak. |
pa.microsoft |
string |
A Punjabi microsoft-elemzője. |
pattern |
string |
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lucene elemző lengyelnek. |
pl.microsoft |
string |
Microsoft analyzer for Lengyel. |
pt-BR.lucene |
string |
Lucene analyzer for Portugál (Brazília). |
pt-BR.microsoft |
string |
Microsoft analyzer for Portugál (Brazília). |
pt-PT.lucene |
string |
Lucene analyzer for Portugál (Portugália). |
pt-PT.microsoft |
string |
Microsoft analyzer for Portugál (Portugália). |
ro.lucene |
string |
Lucene elemző románnak. |
ro.microsoft |
string |
Microsoft analyzer for Román. |
ru.lucene |
string |
Lucene elemző orosznak. |
ru.microsoft |
string |
Microsoft-elemző oroszhoz. |
simple |
string |
Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Microsoft analyzer for Szlovák. |
sl.microsoft |
string |
Szlovén Microsoft-elemző. |
sr-cyrillic.microsoft |
string |
Microsoft analyzer for Serbian (cirill betűs). |
sr-latin.microsoft |
string |
Microsoft analyzer for Szerb (latin). |
standard.lucene |
string |
Standard Lucene elemző. |
standardasciifolding.lucene |
string |
Standard ASCII összecsukható Lucene-elemző. Lásd: https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
Lucene elemző svédnek. |
sv.microsoft |
string |
Microsoft analyzer for Svéd. |
ta.microsoft |
string |
Microsoft analyzer for Tamil. |
te.microsoft |
string |
Microsoft-elemző a Teluguhoz. |
th.lucene |
string |
Lucene elemző thaihoz. |
th.microsoft |
string |
Microsoft analyzer for Thai. |
tr.lucene |
string |
Lucene elemző töröknek. |
tr.microsoft |
string |
Microsoft analyzer for Turkish. |
uk.microsoft |
string |
Microsoft analyzer for Ukrán. |
ur.microsoft |
string |
Microsoft analyzer for Urdu. |
vi.microsoft |
string |
A Vietnami Microsoft elemzője. |
whitespace |
string |
A whitespace tokenizert használó elemző. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Lucene elemző kínaihoz (egyszerűsített). |
zh-Hans.microsoft |
string |
Microsoft Analyzer kínaihoz (egyszerűsített). |
zh-Hant.lucene |
string |
Lucene elemző kínaihoz (hagyományos). |
zh-Hant.microsoft |
string |
Microsoft analyzer for Chinese (Hagyományos). |
LexicalTokenizerName
Meghatározza a keresőmotor által támogatott összes tokenizer nevét.
TokenFilterName
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.