Megosztás a következőn keresztül:


Indexes - Create Or Update

Létrehoz egy új keresési indexet, vagy frissíti az indexet, ha már létezik.

PUT {endpoint}/indexes('{indexName}')?api-version=2024-07-01
PUT {endpoint}/indexes('{indexName}')?allowIndexDowntime={allowIndexDowntime}&api-version=2024-07-01

URI-paraméterek

Name In Kötelező Típus Description
endpoint
path True

string

A keresési szolgáltatás végponti URL-címe.

indexName
path True

string

A létrehozni vagy frissíteni kívánt index definíciója.

api-version
query True

string

Ügyfél API-verziója.

allowIndexDowntime
query

boolean

Lehetővé teszi, hogy az új elemzők, jogkivonat-szűrők, jogkivonatszűrők vagy karakterszűrők legalább néhány másodpercig offline állapotba helyezve legyenek az indexhez. Ez ideiglenesen az indexelés és a lekérdezési kérések sikertelenségéhez vezet. Az index teljesítménye és írási rendelkezésre állása az index frissítése után néhány percig, illetve a nagyon nagy indexek esetében hosszabb ideig is romlhat.

Kérelem fejléce

Name Kötelező Típus Description
x-ms-client-request-id

string (uuid)

A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben.

If-Match

string

Meghatározza a If-Match feltételt. A művelet csak akkor lesz végrehajtva, ha a kiszolgálón lévő ETag megfelel ennek az értéknek.

If-None-Match

string

Meghatározza az If-None-Match feltételt. A művelet csak akkor lesz végrehajtva, ha a kiszolgálón lévő ETag nem egyezik meg ezzel az értékkel.

Prefer True

string

HTTP PUT-kérések esetén utasítja a szolgáltatást, hogy a létrehozott/frissített erőforrást adja vissza a sikerhez.

Kérelem törzse

Name Kötelező Típus Description
fields True

SearchField[]

Az index mezői.

name True

string

Az index neve.

@odata.etag

string

Az index ETagje.

analyzers LexicalAnalyzer[]:

Az index elemzői.

charFilters CharFilter[]:

Az index karakterszűrői.

corsOptions

CorsOptions

Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.

defaultScoringProfile

string

A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.

encryptionKey

SearchResourceEncryptionKey

Az Azure Key Vaultban létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes bizonyosságot szeretne arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal rendelkező titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.

scoringProfiles

ScoringProfile[]

Az index pontozási profiljai.

semantic

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

similarity Similarity:

A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az index létrehozásakor definiálható, és a meglévő indexeken nem módosítható. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.

suggesters

Suggester[]

Az index javaslattevői.

tokenFilters TokenFilter[]:

Az index tokenszűrői.

tokenizers LexicalTokenizer[]:

Az index jogkivonat-szabályzói.

vectorSearch

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

Válaszok

Name Típus Description
200 OK

SearchIndex

201 Created

SearchIndex

Other Status Codes

ErrorResponse

Hibaválasz.

Példák

SearchServiceCreateOrUpdateIndex

Mintakérelem

PUT https://myservice.search.windows.net/indexes('hotels')?allowIndexDowntime=False&api-version=2024-07-01


{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "searchable": true,
      "retrievable": true
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine"
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ]
  }
}

Mintaválasz

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}
{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}

Definíciók

Name Description
AsciiFoldingTokenFilter

Az első 127 ASCII-karakterben nem szereplő betűrendes, numerikus és szimbolikus Unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja, ha léteznek ilyenek. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

AzureActiveDirectoryApplicationCredentials

A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyeket az Azure Key Vaultban tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.

AzureOpenAIEmbeddingSkill

Lehetővé teszi egy vektor beágyazását egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával.

AzureOpenAIModelName

A meghívandó Azure Open AI-modell neve.

AzureOpenAIParameters

Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.

AzureOpenAIVectorizer

Megadja a lekérdezési sztring vektorizálásához használt Azure OpenAI-erőforrást.

BinaryQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt bináris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.

BM25Similarity

Rangsorolási függvény az Okapi BM25 hasonlósági algoritmus alapján. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (a "b" paraméterrel vezérelve), valamint a kifejezés gyakoriságának telítését (amelyet a "k1" paraméter szabályoz).

CharFilterName

Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.

CjkBigramTokenFilter

A standard tokenizerből létrehozott CJK-kifejezések bigramjai. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

CjkBigramTokenFilterScripts

A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.

ClassicSimilarity

Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz-normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.

ClassicTokenizer

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.

CommonGramTokenFilter

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

CorsOptions

Meghatározza az indexek forrásközi erőforrás-megosztásának (CORS) beállítását.

CustomAnalyzer

Lehetővé teszi a szöveg indexelhető/kereshető jogkivonatokká alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős a szöveg jogkivonatokra való feltöréséért, valamint a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőkért.

DictionaryDecompounderTokenFilter

Több germán nyelven található összetett szavakat bont le. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

DistanceScoringFunction

Olyan függvényt határoz meg, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.

DistanceScoringParameters

Paraméterértékeket biztosít egy távolsági pontozási függvénynek.

EdgeNGramTokenFilter

A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

EdgeNGramTokenFilterSide

Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.

EdgeNGramTokenFilterV2

A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

EdgeNGramTokenizer

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

ElisionTokenFilter

Eltávolítja az elisionst. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

ErrorDetail

A hiba részletei.

ErrorResponse

Hibaválasz

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.

FreshnessScoringFunction

Olyan függvényt határoz meg, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.

FreshnessScoringParameters

Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

HnswVectorSearchAlgorithmConfiguration

Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.

InputFieldMappingEntry

Beviteli mező leképezése egy képességhez.

KeepTokenFilter

Olyan jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

KeywordMarkerTokenFilter

Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

KeywordTokenizer

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

KeywordTokenizerV2

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

LengthTokenFilter

Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

LexicalAnalyzerName

Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.

LexicalTokenizerName

Meghatározza a keresőmotor által támogatott összes tokenizer nevét.

LimitTokenFilter

Korlátozza a jogkivonatok számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

LuceneStandardAnalyzer

Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és stop szűrőből áll.

LuceneStandardTokenizer

A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva.

LuceneStandardTokenizerV2

A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva.

MagnitudeScoringFunction

Olyan függvényt határoz meg, amely egy numerikus mező nagysága alapján növeli a pontszámokat.

MagnitudeScoringParameters

Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.

MappingCharFilter

A leképezési beállítással definiált leképezéseket alkalmazó karakterszűrő. A megfeleltetés kapzsi (egy adott pontnál a leghosszabb egyező minta nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

MicrosoftLanguageStemmingTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapformákra csökkenti.

MicrosoftLanguageTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

MicrosoftStemmingTokenizerLanguage

A Microsoft nyelv által támogatott nyelveket sorolja fel a jogkivonat-kezelőből.

MicrosoftTokenizerLanguage

A Microsoft nyelvi tokenizer által támogatott nyelveket sorolja fel.

NGramTokenFilter

A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

NGramTokenFilterV2

A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

NGramTokenizer

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

OutputFieldMappingEntry

Kimeneti mezőleképezés egy képességhez.

PathHierarchyTokenizerV2

Tokenizer elérési utakhoz hasonló hierarchiákhoz. Ez a tokenizer az Apache Lucene használatával van implementálva.

PatternAnalyzer

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva.

PatternCaptureTokenFilter

Java regexes használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

PatternReplaceCharFilter

Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

PatternReplaceTokenFilter

Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

PatternTokenizer

A regex mintaegyezést használó tokenizer különböző jogkivonatok létrehozásához. Ez a tokenizer az Apache Lucene használatával van implementálva.

PhoneticEncoder

A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.

PhoneticTokenFilter

Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

PrioritizedFields

A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszavakmezőket ismerteti.

RegexFlags

Olyan jelzőket határoz meg, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében.

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

ScalarQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.

ScoringFunctionAggregation

Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozófüggvényének eredményét egyesíti.

ScoringFunctionInterpolation

Meghatározza azt a függvényt, amellyel a pontszámok növelhetőek a dokumentumok egy tartományában.

ScoringProfile

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.

SearchField

Egy indexdefinícióban lévő mezőt jelöl, amely egy mező nevét, adattípusát és keresési viselkedését írja le.

SearchFieldDataType

A keresési indexben lévő mezők adattípusát határozza meg.

SearchIndex

A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését írja le.

SearchIndexerDataNoneIdentity

Törli az adatforrás identitástulajdonságát.

SearchIndexerDataUserAssignedIdentity

Megadja a használni kívánt adatforrás identitását.

SearchResourceEncryptionKey

Ügyfél által felügyelt titkosítási kulcs az Azure Key Vaultban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat, például indexeket és szinonimatérképeket.

SemanticConfiguration

Meghatároz egy adott konfigurációt, amelyet a szemantikai képességek kontextusában kell használni.

SemanticField

A szemantikai konfiguráció részeként használt mező.

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

ShingleTokenFilter

A jogkivonatok kombinációit egyetlen jogkivonatként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

SnowballTokenFilter

Egy szűrő, amely egy Snowball által létrehozott őslelő használatával szározza a szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

SnowballTokenFilterLanguage

A Snowball-jogkivonat-szűrőhöz használandó nyelv.

StemmerOverrideTokenFilter

Lehetővé teszi az egyéb eredetszűrők felülbírálását a saját szótáralapú szárzással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, hogy ne legyenek a láncban lévő ősökkel való eredetük. A szűrőt a szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

StemmerTokenFilter

Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

StemmerTokenFilterLanguage

A stemmer token szűrőhöz használandó nyelv.

StopAnalyzer

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.

StopwordsList

A nyelvspecifikus stopszavak előre definiált listáját azonosítja.

StopwordsTokenFilter

Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Suggester

Meghatározza, hogyan kell alkalmazni a Javaslat API-t az index egy mezőcsoportjára.

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

SynonymTokenFilter

Egy vagy többszavas szinonimák egy jogkivonat-streamben. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

TagScoringFunction

Olyan függvényt határoz meg, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.

TagScoringParameters

Paraméterértékeket biztosít egy címkepontozási függvénynek.

TextWeights

Olyan indexmezők súlyozását határozza meg, amelyek esetében az egyezéseknek növelnie kell a keresési lekérdezések pontozását.

TokenCharacterKind

Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.

TokenFilterName

Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.

TruncateTokenFilter

A kifejezéseket egy adott hosszra csonkolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

UaxUrlEmailTokenizer

Tokenizes URL-címek és e-mailek egy jogkivonatként. Ez a tokenizer az Apache Lucene használatával van implementálva.

UniqueTokenFilter

Kiszűri a jogkivonatokat ugyanazzal a szöveggel, mint az előző jogkivonat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

VectorEncodingFormat

A vektormező tartalmának értelmezéséhez használt kódolási formátum.

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

VectorSearchAlgorithmKind

Az indexeléshez és lekérdezéshez használt algoritmus.

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, mint a beágyazási modell betanítása.

VectorSearchCompressionKind

Az indexeléshez és lekérdezéshez használt tömörítési módszer.

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

VectorSearchProfile

A vektorkereséssel használható konfigurációk kombinációját határozza meg.

VectorSearchVectorizerKind

A lekérdezési idő alatt használandó vektorizációs módszer.

WebApiParameters

Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.

WebApiVectorizer

Felhasználó által definiált vektorizálót ad meg a lekérdezési sztring vektorbeágyazásához. A külső vektorizáló integrálása egy készségkészlet egyéni webes API-felületével érhető el.

WordDelimiterTokenFilter

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

AsciiFoldingTokenFilter

Az első 127 ASCII-karakterben nem szereplő betűrendes, numerikus és szimbolikus Unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja, ha léteznek ilyenek. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.AsciiFoldingTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

preserveOriginal

boolean

False

Egy érték, amely jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték hamis.

AzureActiveDirectoryApplicationCredentials

A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyeket az Azure Key Vaultban tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.

Name Típus Description
applicationId

string

Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vaulthoz, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával.

applicationSecret

string

A megadott AAD-alkalmazás hitelesítési kulcsa.

AzureOpenAIEmbeddingSkill

Lehetővé teszi egy vektor beágyazását egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával.

Name Típus Description
@odata.type string:

#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill

Egy URI-töredék, amely megadja a képesség típusát.

apiKey

string

A kijelölt Azure OpenAI-erőforrás API-kulcsa.

authIdentity SearchIndexerDataIdentity:

A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás.

context

string

A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document.

deploymentId

string

Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson.

description

string

A képesség leírása, amely leírja a képesség bemeneteit, kimeneteit és használatát.

dimensions

integer (int32)

Az eredményként kapott kimeneti beágyazások dimenzióinak száma. Csak a text-embedding-3 és újabb modellekben támogatott.

inputs

InputFieldMappingEntry[]

A készségek bemenetei lehetnek a forrásadatkészlet oszlopai, vagy egy felsőbb rétegbeli képesség kimenete.

modelName

AzureOpenAIModelName

A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve.

name

string

Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, "#" karakterrel előtaggal.

outputs

OutputFieldMappingEntry[]

A szakértelem kimenete vagy egy keresési index mezője, vagy egy olyan érték, amelyet egy másik képesség bemenetként használhat fel.

resourceUri

string (uri)

Az Azure OpenAI-erőforrás erőforrás-URI-ja.

AzureOpenAIModelName

A meghívandó Azure Open AI-modell neve.

Érték Description
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

AzureOpenAIParameters

Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.

Name Típus Description
apiKey

string

A kijelölt Azure OpenAI-erőforrás API-kulcsa.

authIdentity SearchIndexerDataIdentity:

A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás.

deploymentId

string

Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson.

modelName

AzureOpenAIModelName

A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve.

resourceUri

string (uri)

Az Azure OpenAI-erőforrás erőforrás-URI-ja.

AzureOpenAIVectorizer

Megadja a lekérdezési sztring vektorizálásához használt Azure OpenAI-erőforrást.

Name Típus Description
azureOpenAIParameters AzureOpenAIParameters:

AzureOpenAIEmbeddingSkill

Az Azure OpenAI beágyazási vektorizálására vonatkozó paramétereket tartalmazza.

kind string:

azureOpenAI

A vektorkereséshez konfigurált vektorizációs módszer neve.

name

string

Az adott vektorizálási metódushoz társítandó név.

BinaryQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt bináris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.

Name Típus Alapértelmezett érték Description
defaultOversampling

number (double)

Alapértelmezett túlmintavételi tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámával újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors értéke igaz. A magasabb értékek a késés rovására javítják a visszahívást.

kind string:

binaryQuantization

A vektorkereséshez konfigurált tömörítési módszer neve.

name

string

Az adott konfigurációhoz társítandó név.

rerankWithOriginalVectors

boolean

True

Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredménykészlet lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást.

BM25Similarity

Rangsorolási függvény az Okapi BM25 hasonlósági algoritmus alapján. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (a "b" paraméterrel vezérelve), valamint a kifejezés gyakoriságának telítését (amelyet a "k1" paraméter szabályoz).

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.BM25Similarity

b

number (double)

Ez a tulajdonság szabályozza, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75-ös értéket használ. A 0,0 érték azt jelenti, hogy a program nem alkalmaz hossz normalizálást, míg az 1,0 érték azt jelenti, hogy a pontszámot a dokumentum hossza teljesen normalizálja.

k1

number (double)

Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével.

CharFilterName

Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.

Érték Description
html_strip

Egy karakterszűrő, amely megpróbálja kiszűrni a HTML-szerkezeteket. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

A standard tokenizerből létrehozott CJK-kifejezések bigramjai. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.CjkBigramTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

ignoreScripts

CjkBigramTokenFilterScripts[]

A figyelmen kívül hagyandó szkriptek.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

outputUnigrams

boolean

False

Egy érték, amely azt jelzi, hogy az unigramokat és a bigramokat is ki kell-e adni (ha igaz), vagy csak bigramokat (ha hamis). Az alapértelmezett érték hamis.

CjkBigramTokenFilterScripts

A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.

Érték Description
han

A CJK-kifejezések bigramjainak létrehozásakor figyelmen kívül hagyja a Han-szkriptet.

hangul

Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

hiragana

Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

katakana

Hagyja figyelmen kívül a Katakana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

ClassicSimilarity

Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz-normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.ClassicTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer (int32)

maximum: 300
255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

CommonGramTokenFilter

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.CommonGramTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

commonWords

string[]

A közös szavak halmaza.

ignoreCase

boolean

False

Egy érték, amely jelzi, hogy a közös szavak egyeztetése érzéketlen lesz-e a kis- és nagybetűk között. Az alapértelmezett érték hamis.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

queryMode

boolean

False

Egy érték, amely jelzi, hogy a jogkivonat szűrője lekérdezési módban van-e. Lekérdezési módban a jogkivonat-szűrő bigramokat hoz létre, majd eltávolítja a közös szavakat és az egyszavas kifejezéseket, amelyeket egy közös szó követ. Az alapértelmezett érték hamis.

CorsOptions

Meghatározza az indexek forrásközi erőforrás-megosztásának (CORS) beállítását.

Name Típus Description
allowedOrigins

string[]

Azon források listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. A(z) {protocol}://{teljes-qualified-domain-name}[:{port#}] űrlap gazdagépeinek listáját vagy egyetlen "*" elemet is tartalmazhat az összes forrás engedélyezéséhez (nem ajánlott).

maxAgeInSeconds

integer (int64)

Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc.

CustomAnalyzer

Lehetővé teszi a szöveg indexelhető/kereshető jogkivonatokká alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős a szöveg jogkivonatokra való feltöréséért, valamint a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőkért.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.CustomAnalyzer

Az elemző típusát meghatározó URI-töredék.

charFilters

CharFilterName[]

A bemeneti szövegnek a tokenizer általi feldolgozása előtt történő előkészítéséhez használt karakterszűrők listája. Például lecserélhetnek bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

tokenFilters

TokenFilterName[]

A jogkivonat-létrehozó által létrehozott jogkivonatok kiszűrésére vagy módosítására használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak.

tokenizer

LexicalTokenizerName

A jogkivonat-megosztó neve, a folyamatos szöveg jogkivonatok sorozatára való felosztásához, például egy mondat szavakra töréséhez.

DictionaryDecompounderTokenFilter

Több germán nyelven található összetett szavakat bont le. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

maxSubwordSize

integer (int32)

maximum: 300
15

A maximális alszóméret. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300.

minSubwordSize

integer (int32)

maximum: 300
2

A minimális alszóméret. A rendszer csak ennél hosszabb alszavakat ad ki. Az alapértelmezett érték 2. A maximális érték 300.

minWordSize

integer (int32)

maximum: 300
5

A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

onlyLongestMatch

boolean

False

Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót kell-e hozzáadni a kimenethez. Az alapértelmezett érték hamis.

wordList

string[]

Azoknak a szavaknak a listája,

DistanceScoringFunction

Olyan függvényt határoz meg, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.

Name Típus Description
boost

number (double)

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal.

distance

DistanceScoringParameters

A távolságpontozási függvény paraméterértékei.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".

type string:

distance

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

DistanceScoringParameters

Paraméterértékeket biztosít egy távolsági pontozási függvénynek.

Name Típus Description
boostingDistance

number (double)

Az a távolság, amely kilométerben van attól a referenciahelytől, ahol a kiemelési tartomány véget ér.

referencePointParameter

string

A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához.

EdgeNGramTokenFilter

A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

maxGram

integer (int32)

2

A maximális n-gram hossz. Az alapértelmezett érték 2.

minGram

integer (int32)

1

Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

side

EdgeNGramTokenFilterSide

front

Megadja, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér".

EdgeNGramTokenFilterSide

Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.

Érték Description
back

Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni.

front

Megadja, hogy az n-gramot a bemenet elejéről kell létrehozni.

EdgeNGramTokenFilterV2

A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilterV2

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

maxGram

integer (int32)

maximum: 300
2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer (int32)

maximum: 300
1

Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

side

EdgeNGramTokenFilterSide

front

Megadja, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér".

EdgeNGramTokenizer

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxGram

integer (int32)

maximum: 300
2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer (int32)

maximum: 300
1

Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

tokenChars

TokenCharacterKind[]

A jogkivonatokban megtartandó karakterosztályok.

ElisionTokenFilter

Eltávolítja az elisionst. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.ElisionTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

articles

string[]

Az eltávolítandó cikkek készlete.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

Name Típus Description
info

object

A további információk.

type

string

A további információtípus.

ErrorDetail

A hiba részletei.

Name Típus Description
additionalInfo

ErrorAdditionalInfo[]

A hiba további információi.

code

string

A hibakód.

details

ErrorDetail[]

A hiba részletei.

message

string

A hibaüzenet.

target

string

A hibacél.

ErrorResponse

Hibaválasz

Name Típus Description
error

ErrorDetail

A hibaobjektum.

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

Name Típus Description
metric

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.

Name Típus Description
exhaustiveKnnParameters

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

kind string:

exhaustiveKnn

A vektorkereséshez konfigurált algoritmus neve.

name

string

Az adott konfigurációhoz társítandó név.

FreshnessScoringFunction

Olyan függvényt határoz meg, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.

Name Típus Description
boost

number (double)

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

freshness

FreshnessScoringParameters

A frissesség-pontozási függvény paraméterértékei.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".

type string:

freshness

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

FreshnessScoringParameters

Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.

Name Típus Description
boostingDuration

string (duration)

Az a lejárati időszak, amely után a kiemelés leáll egy adott dokumentum esetében.

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

Name Típus Alapértelmezett érték Description
efConstruction

integer (int32)

minimum: 100
maximum: 1000
400

A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az index ideje alatt használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet.

efSearch

integer (int32)

minimum: 100
maximum: 1000
500

A keresési idő alatt használt legközelebbi szomszédokat tartalmazó dinamikus lista mérete. A paraméter növelése javíthatja a keresési eredményeket a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet.

m

integer (int32)

minimum: 4
maximum: 10
4

A kétirányú kapcsolatok száma, amelyek minden új elemhez létrejönnek az építés során. A paraméter értékének növelése javíthatja a nagy belső dimenziójú adathalmazok visszahívási és lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására.

metric

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

HnswVectorSearchAlgorithmConfiguration

Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.

Name Típus Description
hnswParameters

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

kind string:

hnsw

A vektorkereséshez konfigurált algoritmus neve.

name

string

Az adott konfigurációhoz társítandó név.

InputFieldMappingEntry

Beviteli mező leképezése egy képességhez.

Name Típus Description
inputs

InputFieldMappingEntry[]

Az összetett típus létrehozásakor használt rekurzív bemenetek.

name

string

A bemenet neve.

source

string

A bemenet forrása.

sourceContext

string

A rekurzív bemenetek kiválasztásához használt forráskörnyezet.

KeepTokenFilter

Olyan jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeepTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

keepWords

string[]

A megtartandó szavak listája.

keepWordsCase

boolean

False

Egy érték, amely azt jelzi, hogy az összes szót először kisbetűvel kell-e kisbetűsíteni. Az alapértelmezett érték hamis.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordMarkerTokenFilter

Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeywordMarkerTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

ignoreCase

boolean

False

A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték hamis.

keywords

string[]

Kulcsszavakként megjelölendő szavak listája.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizer

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizer

A tokenizer típusát meghatározó URI-töredék.

bufferSize

integer (int32)

256

Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizerV2

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizerV2

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer (int32)

maximum: 300
256

A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LengthTokenFilter

Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.LengthTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

max

integer (int32)

maximum: 300
300

A karakterek maximális hossza. Az alapértelmezett érték és a maximális érték 300.

min

integer (int32)

maximum: 300
0

A karakterek minimális hossza. Az alapértelmezett érték 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LexicalAnalyzerName

Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.

Érték Description
ar.lucene

Lucene elemző arabhoz.

ar.microsoft

Microsoft analyzer for Arab.

bg.lucene

Lucene elemző bolgárnak.

bg.microsoft

Microsoft analyzer for Bolgár.

bn.microsoft

A Bangla Microsoft-elemzője.

ca.lucene

Lucene elemző katalánnak.

ca.microsoft

A Katalán Microsoft elemzője.

cs.lucene

Lucene elemző csehnek.

cs.microsoft

Microsoft analyzer for Czech.

da.lucene

Lucene elemző dánnak.

da.microsoft

Microsoft analyzer dán nyelven.

de.lucene

Lucene elemző németnek.

de.microsoft

Microsoft analyzer for German.

el.lucene

Lucene elemző görögnek.

el.microsoft

Microsoft analyzer for Greek.

en.lucene

Lucene elemző angolul.

en.microsoft

Microsoft analyzer for English.

es.lucene

Lucene elemző spanyolnak.

es.microsoft

Microsoft analyzer for Spanyol.

et.microsoft

Microsoft analyzer az észtekhez.

eu.lucene

Lucene elemző baszknak.

fa.lucene

Lucene elemző perzsa.

fi.lucene

Lucene elemző finnnek.

fi.microsoft

Microsoft analyzer for Finn.

fr.lucene

Lucene elemző franciának.

fr.microsoft

Microsoft analyzer for French.

ga.lucene

Lucene elemző írnek.

gl.lucene

Lucene elemző galíciainak.

gu.microsoft

Microsoft analyzer for Gujarati.

he.microsoft

Microsoft analyzer for Héber.

hi.lucene

Lucene elemző hindinek.

hi.microsoft

Microsoft analyzer for Hindi.

hr.microsoft

Microsoft analyzer for Horvát.

hu.lucene

Lucene elemző magyarnak.

hu.microsoft

Microsoft analyzer for Hungarian.

hy.lucene

Lucene elemző örménynek.

id.lucene

Lucene elemző indonéznek.

id.microsoft

Indonéz Microsoft-elemző (Bahasa).

is.microsoft

A Microsoft izlandi elemzője.

it.lucene

Lucene elemző olasznak.

it.microsoft

Microsoft analyzer for Italian.

ja.lucene

Lucene elemző japánnak.

ja.microsoft

Microsoft Analyzer japánhoz.

keyword

Egy mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és néhány terméknév. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

kn.microsoft

A Kannada Microsoft-elemzője.

ko.lucene

Lucene elemző koreainak.

ko.microsoft

Microsoft-elemző koreaihoz.

lt.microsoft

Microsoft-elemző litvánhoz.

lv.lucene

Lucene elemző lettnek.

lv.microsoft

Microsoft analyzer for Lett.

ml.microsoft

Microsoft-elemző malajalamhoz.

mr.microsoft

Marathi Microsoft-elemzője.

ms.microsoft

Microsoft Analyzer for Maly (latin).

nb.microsoft

Microsoft analyzer for Norwegian (Bokmål).

nl.lucene

Lucene elemző hollandnak.

nl.microsoft

Microsoft analyzer for Holland.

no.lucene

Lucene elemző norvégnak.

pa.microsoft

A Punjabi microsoft-elemzője.

pattern

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

pl.lucene

Lucene elemző lengyelnek.

pl.microsoft

Microsoft analyzer for Lengyel.

pt-BR.lucene

Lucene analyzer for Portugál (Brazília).

pt-BR.microsoft

Microsoft analyzer for Portugál (Brazília).

pt-PT.lucene

Lucene analyzer for Portugál (Portugália).

pt-PT.microsoft

Microsoft analyzer for Portugál (Portugália).

ro.lucene

Lucene elemző románnak.

ro.microsoft

Microsoft analyzer for Román.

ru.lucene

Lucene elemző orosznak.

ru.microsoft

Microsoft-elemző oroszhoz.

simple

Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

sk.microsoft

Microsoft analyzer for Szlovák.

sl.microsoft

Szlovén Microsoft-elemző.

sr-cyrillic.microsoft

Microsoft analyzer for Serbian (cirill betűs).

sr-latin.microsoft

Microsoft analyzer for Szerb (latin).

standard.lucene

Standard Lucene elemző.

standardasciifolding.lucene

Standard ASCII összecsukható Lucene-elemző. Lásd: https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

stop

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

sv.lucene

Lucene elemző svédnek.

sv.microsoft

Microsoft analyzer for Svéd.

ta.microsoft

Microsoft analyzer for Tamil.

te.microsoft

Microsoft-elemző a Teluguhoz.

th.lucene

Lucene elemző thaihoz.

th.microsoft

Microsoft analyzer for Thai.

tr.lucene

Lucene elemző töröknek.

tr.microsoft

Microsoft analyzer for Turkish.

uk.microsoft

Microsoft analyzer for Ukrán.

ur.microsoft

Microsoft analyzer for Urdu.

vi.microsoft

A Vietnami Microsoft elemzője.

whitespace

A whitespace tokenizert használó elemző. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

zh-Hans.lucene

Lucene elemző kínaihoz (egyszerűsített).

zh-Hans.microsoft

Microsoft Analyzer kínaihoz (egyszerűsített).

zh-Hant.lucene

Lucene elemző kínaihoz (hagyományos).

zh-Hant.microsoft

Microsoft analyzer for Chinese (Hagyományos).

LexicalTokenizerName

Meghatározza a keresőmotor által támogatott összes tokenizer nevét.

Érték Description
classic

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

A szöveget nem betűkkel osztja el. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_stemming_tokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapformákra csökkenti.

microsoft_language_tokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

nGram

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

Tokenizer elérési utakhoz hasonló hierarchiákhoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

A regex mintaegyezést használó tokenizer különböző jogkivonatok létrehozásához. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

Standard Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és stop szűrőből áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

Tokenizes URL-címek és e-mailek egy jogkivonatként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

A szóközön lévő szöveget osztja el. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Korlátozza a jogkivonatok számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.LimitTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

consumeAllTokens

boolean

False

Egy érték, amely azt jelzi, hogy a bemenet összes jogkivonatát akkor is fel kell-e használni, ha eléri a maxTokenCount értéket. Az alapértelmezett érték hamis.

maxTokenCount

integer (int32)

1

A létrehozandó jogkivonatok maximális száma. Az alapértelmezett érték 1.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardAnalyzer

Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és stop szűrőből áll.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StandardAnalyzer

Az elemző típusát meghatározó URI-töredék.

maxTokenLength

integer (int32)

maximum: 300
255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

stopwords

string[]

A stopwords listája.

LuceneStandardTokenizer

A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer (int32)

255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardTokenizerV2

A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizerV2

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer (int32)

maximum: 300
255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MagnitudeScoringFunction

Olyan függvényt határoz meg, amely egy numerikus mező nagysága alapján növeli a pontszámokat.

Name Típus Description
boost

number (double)

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".

magnitude

MagnitudeScoringParameters

A magnitúdópontozási függvény paraméterértékei.

type string:

magnitude

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

MagnitudeScoringParameters

Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.

Name Típus Description
boostingRangeEnd

number (double)

Az a mezőérték, amelynél a kiemelés véget ér.

boostingRangeStart

number (double)

Az a mezőérték, amelynél a kiemelés elindul.

constantBoostBeyondRange

boolean

Egy érték, amely azt jelzi, hogy a tartomány végértékét meghaladó mezőértékekre állandó lökést kell-e alkalmazni; alapértelmezett értéke hamis.

MappingCharFilter

A leképezési beállítással definiált leképezéseket alkalmazó karakterszűrő. A megfeleltetés kapzsi (egy adott pontnál a leghosszabb egyező minta nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.MappingCharFilter

A karakterszűrő típusát meghatározó URI-töredék.

mappings

string[]

A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása "b" karakterrel lesz helyettesítve).

name

string

A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageStemmingTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapformákra csökkenti.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer

A tokenizer típusát meghatározó URI-töredék.

isSearchTokenizer

boolean

False

A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-képzőként használják, állítsa hamis értékre, ha indexelő jogkivonat-képzőként használják. Az alapértelmezett érték hamis.

language

MicrosoftStemmingTokenizerLanguage

A használni kívánt nyelv. Az alapértelmezett érték az angol.

maxTokenLength

integer (int32)

maximum: 300
255

A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hossza alapján történik. Az alapértelmezett érték 255.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageTokenizer

A tokenizer típusát meghatározó URI-töredék.

isSearchTokenizer

boolean

False

A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-képzőként használják, állítsa hamis értékre, ha indexelő jogkivonat-képzőként használják. Az alapértelmezett érték hamis.

language

MicrosoftTokenizerLanguage

A használni kívánt nyelv. Az alapértelmezett érték az angol.

maxTokenLength

integer (int32)

maximum: 300
255

A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hossza alapján történik. Az alapértelmezett érték 255.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftStemmingTokenizerLanguage

A Microsoft nyelv által támogatott nyelveket sorolja fel a jogkivonat-kezelőből.

Érték Description
arabic

Kiválasztja a Microsoft által használt jogkivonat-kezelőt arab nyelven.

bangla

A Bangla microsoftos jogkivonat-kezelőjének kiválasztása.

bulgarian

Kiválasztja a microsoftos jogkivonat-kezelőt a bolgárhoz.

catalan

Kiválasztja a Katalán Microsoft-jogkivonat-kezelőt.

croatian

Kiválasztja a microsoftos jogkivonat-kezelőt a horváthoz.

czech

Kiválasztja a Microsoft által használt jogkivonat-kezelőt a csehhez.

danish

Kiválasztja a microsoftos jogkivonat-kezelőt dán nyelven.

dutch

Kiválasztja a Microsoft által használt jogkivonat-kezelőt a hollandhoz.

english

Kiválasztja a Microsoft által használt jogkivonat-kezelőt angol nyelven.

estonian

Kiválasztja az észt Microsoft-jogkivonat-kezelőt.

finnish

Kiválasztja a Finn Microsoft-alapú jogkivonat-kezelőt.

french

Kiválasztja a Microsoft által használt jogkivonat-kezelőt franciául.

german

Kiválasztja a microsoftos jogkivonat-kezelőt a német nyelvhez.

greek

Kiválasztja a microsoftos jogkivonat-kezelőt a göröghöz.

gujarati

Kiválasztja a Microsoft által létrehozott jogkivonat-kezelőt a Gujaratihoz.

hebrew

Kiválasztja a Héberhez készült Microsoft-jogkivonat-kezelőt.

hindi

Kiválasztja a Hindihez készült Microsoft-jogkivonat-kezelőt.

hungarian

Kiválasztja a microsoftos jogkivonat-kezelőt a magyarhoz.

icelandic

Kiválasztja az izlandi Microsoft-jogkivonat-kezelőt.

indonesian

Kiválasztja az indonéz Microsoft-jogkivonat-kezelőt.

italian

Kiválasztja az olasz microsoftos jogkivonat-kezelőt.

kannada

A Kannada microsoftos jogkivonat-kezelőjének kiválasztása.

latvian

Kiválasztja a microsoftos jogkivonat-kezelőt a lett nyelvhez.

lithuanian

Kiválasztja a microsoftos jogkivonat-kezelőt a litvánhoz.

malay

Kiválasztja a Malájhoz tartozó Microsoft-jogkivonat-kezelőt.

malayalam

Kiválasztja a Malájlamhoz tartozó Microsoft-jogkivonat-kezelőt.

marathi

Kiválasztja a Marathihoz tartozó Microsoft-jogkivonat-kezelőt.

norwegianBokmaal

A Norvég (Bokmål) microsoftos jogkivonat-kezelőt választja ki.

polish

Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a lengyelhez.

portuguese

Kiválasztja a Portugál Microsoft-jogkivonat-kezelőt.

portugueseBrazilian

Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-kezelőt.

punjabi

Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-kezelőt.

romanian

Kiválasztja a Microsoft által használt jogkivonat-kezelőt a román nyelvhez.

russian

Kiválasztja az orosz microsoftos jogkivonat-kezelőt.

serbianCyrillic

Kiválasztja a Szerb (cirill betűs) Microsoft-jogkivonat-kezelőt.

serbianLatin

Kiválasztja a Microsoft által használt jogkivonat-jelölőt a szerb (latin) nyelvhez.

slovak

Kiválasztja a microsoftos jogkivonat-kezelőt a szlovák nyelvhez.

slovenian

Kiválasztja a szlovén microsoftos jogkivonat-kezelőt.

spanish

Kiválasztja a Microsoft által használt jogkivonat-kezelőt spanyol nyelven.

swedish

Kiválasztja a microsoftos jogkivonat-kezelőt svéd nyelven.

tamil

Kiválasztja a Microsoft által használt jogkivonat-kezelőt a Tamilhez.

telugu

Kiválasztja a Teluguhoz készült Microsoft-jogkivonat-kezelőt.

turkish

Kiválasztja a Microsoft által a törökhöz használt jogkivonat-kezelőt.

ukrainian

Kiválasztja az ukrán microsoftos jogkivonat-kezelőt.

urdu

Kiválasztja az Urduhoz tartozó Microsoft-jogkivonat-kezelőt.

MicrosoftTokenizerLanguage

A Microsoft nyelvi tokenizer által támogatott nyelveket sorolja fel.

Érték Description
bangla

A Bangla Microsoft-jogkivonat-jelölőjének kiválasztása.

bulgarian

Kiválasztja a Microsoft bolgár jogkivonat-jelölőt.

catalan

Kiválasztja a Katalán Microsoft-jogkivonat-jelölőt.

chineseSimplified

Kiválasztja a Microsoft kínai jogkivonat-készítőt (egyszerűsített).

chineseTraditional

Kiválasztja a Microsoft kínai (hagyományos) tokenizert.

croatian

Kiválasztja a Horvát Microsoft-jogkivonat-jelölőt.

czech

Kiválasztja a Cseh Microsoft tokenizert.

danish

Kiválasztja a Dán Microsoft tokenizert.

dutch

Kiválasztja a Microsoft holland jogkivonat-jelölőt.

english

A Microsoft angol jogkivonat-jelölőjének kiválasztása.

french

A Microsoft francia jogkivonat-jelölőjének kiválasztása.

german

Kiválasztja a Német Microsoft tokenizert.

greek

Kiválasztja a Microsoft-jogkivonat-jelölőt a göröghöz.

gujarati

Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz.

hindi

Kiválasztja a Hindihez készült Microsoft tokenizert.

icelandic

Kiválasztja az izlandi Microsoft tokenizert.

indonesian

Kiválasztja az indonéz Microsoft tokenizert.

italian

Kiválasztja az olasz Microsoft tokenizert.

japanese

Kiválasztja a Japánhoz készült Microsoft tokenizert.

kannada

A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása.

korean

Kiválasztja a Microsoft koreai jogkivonat-jelölőt.

malay

Kiválasztja a Maláj Microsoft-jogkivonat-jelölőt.

malayalam

Kiválasztja a Microsoft malajalam-jogkivonat-jelölőt.

marathi

Kiválasztja a Marathihoz készült Microsoft tokenizert.

norwegianBokmaal

Kiválasztja a Microsoft tokenizer for Norwegian (Bokmål) lehetőséget.

polish

A Microsoft lengyel jogkivonat-jelölőjének kiválasztása.

portuguese

Kiválasztja a Portugál Microsoft tokenizert.

portugueseBrazilian

Kiválasztja a Portugál (Brazília) Microsoft tokenizert.

punjabi

Kiválasztja a Punjabihoz készült Microsoft tokenizert.

romanian

Kiválasztja a Microsoft román jogkivonat-jelölőt.

russian

Kiválasztja az orosz microsoft jogkivonat-jelölőt.

serbianCyrillic

A Szerb (cirill betűs) Microsoft tokenizer kiválasztása.

serbianLatin

Kiválasztja a Microsoft tokenizert szerb (latin) nyelven.

slovenian

Kiválasztja a szlovén Microsoft tokenizert.

spanish

Kiválasztja a Microsoft spanyol jogkivonat-jelölőt.

swedish

Kiválasztja a Microsoft svéd jogkivonat-jelölőt.

tamil

A Microsoft Tamil-jogkivonat-jelölőjének kiválasztása.

telugu

A Microsoft telugu-jogkivonat-jelölőjének kiválasztása.

thai

Kiválasztja a Microsoft thai jogkivonat-kezelőt.

ukrainian

Kiválasztja az ukrán Microsoft tokenizert.

urdu

Kiválasztja az Urduhoz készült Microsoft-jogkivonat-jelölőt.

vietnamese

Kiválasztja a vietnami Microsoft tokenizert.

NGramTokenFilter

A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

maxGram

integer (int32)

2

A maximális n-gram hossz. Az alapértelmezett érték 2.

minGram

integer (int32)

1

Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenFilterV2

A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilterV2

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

maxGram

integer (int32)

maximum: 300
2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer (int32)

maximum: 300
1

Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenizer

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxGram

integer (int32)

maximum: 300
2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer (int32)

maximum: 300
1

Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

tokenChars

TokenCharacterKind[]

A jogkivonatokban megtartandó karakterosztályok.

OutputFieldMappingEntry

Kimeneti mezőleképezés egy képességhez.

Name Típus Description
name

string

A képesség által definiált kimenet neve.

targetName

string

A kimenet célneve. A név megadása nem kötelező, és alapértelmezés szerint a név megadása kötelező.

PathHierarchyTokenizerV2

Tokenizer elérési utakhoz hasonló hierarchiákhoz. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PathHierarchyTokenizerV2

A tokenizer típusát meghatározó URI-töredék.

delimiter

string (char)

/

A használandó elválasztó karakter. Az alapértelmezett érték a "/".

maxTokenLength

integer (int32)

maximum: 300
300

A jogkivonat maximális hossza. Az alapértelmezett érték és a maximális érték 300.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

replacement

string (char)

/

Egy érték, amely ha be van állítva, az elválasztó karaktert helyettesíti. Az alapértelmezett érték a "/".

reverse

boolean

False

Egy érték, amely jelzi, hogy fordított sorrendben hoz-e létre jogkivonatokat. Az alapértelmezett érték hamis.

skip

integer (int32)

0

A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték 0.

PatternAnalyzer

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PatternAnalyzer

Az elemző típusát meghatározó URI-töredék.

flags

RegexFlags

Reguláris kifejezésjelölők.

lowercase

boolean

True

Érték, amely jelzi, hogy a kifejezések kisbetűsek-e. Az alapértelmezett érték igaz.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

\W+

A tokenelválasztóknak megfelelő reguláris kifejezésminta. Az alapértelmezett kifejezés egy vagy több nem szó karakternek felel meg.

stopwords

string[]

A stopwords listája.

PatternCaptureTokenFilter

Java regexes használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PatternCaptureTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

patterns

string[]

Az egyes tokenekkel egyeztetendő minták listája.

preserveOriginal

boolean

True

Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta egyezik. Az alapértelmezett érték igaz.

PatternReplaceCharFilter

Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceCharFilter

A karakterszűrő típusát meghatározó URI-töredék.

name

string

A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

Egy reguláris kifejezésminta.

replacement

string

A helyettesítő szöveg.

PatternReplaceTokenFilter

Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

Egy reguláris kifejezésminta.

replacement

string

A helyettesítő szöveg.

PatternTokenizer

A regex mintaegyezést használó tokenizer különböző jogkivonatok létrehozásához. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PatternTokenizer

A tokenizer típusát meghatározó URI-töredék.

flags

RegexFlags

Reguláris kifejezésjelölők.

group

integer (int32)

-1

A normál kifejezésmintában lévő egyező csoport nulla alapú sorszáma, amely tokenekké lesznek kinyerve. Használja a -1, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

\W+

A tokenelválasztóknak megfelelő reguláris kifejezésminta. Az alapértelmezett kifejezés egy vagy több nem szó karakternek felel meg.

PhoneticEncoder

A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.

Érték Description
beiderMorse

Kódol egy jogkivonatot egy Beider-Morse értékre.

caverphone1

Kódol egy tokent egy Caverphone 1.0-értékre.

caverphone2

Kódol egy tokent egy Caverphone 2.0-értékre.

cologne

Kódol egy jogkivonatot egy kölni fonetikai értékre.

doubleMetaphone

Egy jogkivonatot dupla metafonértékké kódol.

haasePhonetik

Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase-finomításával.

koelnerPhonetik

Kódol egy jogkivonatot a Kölner Phonetik algoritmussal.

metaphone

Kódol egy jogkivonatot egy Metaphone-értékbe.

nysiis

Kódol egy jogkivonatot EGY NYSIIS-értékbe.

refinedSoundex

Egy jogkivonatot pontosított Soundex-értékre kódol.

soundex

Egy jogkivonatot Egy Soundex-értékbe kódol.

PhoneticTokenFilter

Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PhoneticTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

encoder

PhoneticEncoder

metaphone

A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone".

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

replace

boolean

True

Egy érték, amely jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Az alapértelmezett érték igaz.

PrioritizedFields

A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszavakmezőket ismerteti.

Name Típus Description
prioritizedContentFields

SemanticField[]

Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.

prioritizedKeywordsFields

SemanticField[]

Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.

titleField

SemanticField

Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó címmezőt. Ha nem szerepel címmező az indexben, hagyja üresen.

RegexFlags

Olyan jelzőket határoz meg, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében.

Érték Description
CANON_EQ

Engedélyezi a canonikus egyenértékűséget.

CASE_INSENSITIVE

Engedélyezi a kis- és nagybetűk érzéketlen egyeztetését.

COMMENTS

Engedélyezi a térközt és a megjegyzéseket a mintában.

DOTALL

Engedélyezi a dotall módot.

LITERAL

Lehetővé teszi a minta literális elemzését.

MULTILINE

Engedélyezi a többsoros módot.

UNICODE_CASE

Engedélyezi a Unicode-ra képes kis- és nagybetűk összecsukását.

UNIX_LINES

Engedélyezi a Unix-vonalak üzemmódot.

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

Name Típus Description
quantizedDataType

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

ScalarQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.

Name Típus Alapértelmezett érték Description
defaultOversampling

number (double)

Alapértelmezett túlmintavételi tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámával újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors értéke igaz. A magasabb értékek a késés rovására javítják a visszahívást.

kind string:

scalarQuantization

A vektorkereséshez konfigurált tömörítési módszer neve.

name

string

Az adott konfigurációhoz társítandó név.

rerankWithOriginalVectors

boolean

True

Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredménykészlet lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást.

scalarQuantizationParameters

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

ScoringFunctionAggregation

Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozófüggvényének eredményét egyesíti.

Érték Description
average

A pontszámok növelése az összes pontozó függvény eredményének átlagával.

firstMatching

A pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével.

maximum

A pontszámok növelése az összes pontozó függvény eredményének maximális értékével.

minimum

A pontszámok növelése az összes pontozó függvény eredményének minimális értékével.

sum

A pontszámok növelése az összes pontozó függvény eredményének összegével.

ScoringFunctionInterpolation

Meghatározza azt a függvényt, amellyel a pontszámok növelhetőek a dokumentumok egy tartományában.

Érték Description
constant

Állandó tényezővel növeli a pontszámokat.

linear

Lineárisan csökkenő összeggel növeli a pontszámokat. Ez a pontozási függvények alapértelmezett interpolációja.

logarithmic

A pontszámokat olyan mennyiséggel növeli, amely logaritmikusan csökken. A kiemelések gyorsan csökkennek a magasabb pontszámok esetén, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben.

quadratic

A pontszámokat a kvadratikusan csökkenő összeggel növeli. A kiemelések a magasabb pontszámok esetében lassan csökkennek, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben.

ScoringProfile

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.

Name Típus Description
functionAggregation

ScoringFunctionAggregation

Az egyes pontozási függvények eredményeinek kombinálását jelző érték. Alapértelmezés szerint "Összeg". Figyelmen kívül hagyja, ha nincsenek pontozófüggvények.

functions ScoringFunction[]:

A dokumentumok pontozását befolyásoló függvények gyűjteménye.

name

string

A pontozási profil neve.

text

TextWeights

Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást.

SearchField

Egy indexdefinícióban lévő mezőt jelöl, amely egy mező nevét, adattípusát és keresési viselkedését írja le.

Name Típus Description
analyzer

LexicalAnalyzerName

A mezőhöz használni kívánt elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be együtt sem a searchAnalyzer, sem az indexAnalyzer beállítással. Az elemző kiválasztása után a mező nem módosítható. Összetett mezők esetén null értékűnek kell lennie.

dimensions

integer (int32)

minimum: 2
maximum: 2048

A vektormező dimenziója.

facetable

boolean

Érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. A találatok kategóriánkénti számát (például digitális kamerák keresését és a találatok márka, megapixel, ár stb. alapján történő megtekintését) tartalmazó találatok bemutatójában általában használják. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy a Collection (Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz.

fields

SearchField[]

Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie.

filterable

boolean

Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető érték eltér a sztringek kezelési módjában kereshetőtől. A szűrhető Edm.String vagy Collection (Edm.String) típusú mezők nem esnek szófelhővé, ezért az összehasonlítások csak pontos egyezéseket tartalmaznak. Ha például egy ilyen f mezőt "napos napra" állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig null értékű.

indexAnalyzer

LexicalAnalyzerName

A mező indexelési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és az elemző beállítással együtt nem állítható be. Ez a tulajdonság nem állítható be egy nyelvelemző nevére; használja az elemző tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után a mező nem módosítható. Összetett mezők esetén null értékűnek kell lennie.

key

boolean

Érték, amely jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők a dokumentumok közvetlen keresésére és adott dokumentumok frissítésére vagy törlésére használhatók. Az alapértelmezett érték az egyszerű mezők esetében hamis, az összetett mezők esetében pedig null.

name

string

A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében.

retrievable

boolean

Egy érték, amely azt jelzi, hogy a mező visszaadható-e a keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezőkre, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság a meglévő mezőkön módosítható. A tulajdonság engedélyezése nem jár az indextárolási követelmények növekedésével. Az alapértelmezett érték igaz az egyszerű mezőkre, a vektormezőkre hamis, az összetett mezőkre pedig null értékre.

searchAnalyzer

LexicalAnalyzerName

A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be együtt az elemző beállítással. Ez a tulajdonság nem állítható be egy nyelvelemző nevére; használja az elemző tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőben. Összetett mezők esetén null értékűnek kell lennie.

searchable

boolean

Egy érték, amely azt jelzi, hogy a mező kereshető-e teljes szöveges formátumban. Ez azt jelenti, hogy az indexelés során elemzést végez, például szótörést. Ha egy kereshető mezőt olyan értékre állít be, mint a "napos nap", a rendszer belsőleg a "napos" és a "nap" egyedi jogkivonatokra lesz felosztva. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection (Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben a mezőérték további jogkivonatos verzióinak elhelyezéséhez a teljes szöveges keresésekhez. Ha helyet szeretne menteni az indexben, és nincs szüksége olyan mezőre, amely szerepel a keresésekben, állítsa a kereshető értéket hamisra.

sortable

boolean

Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Egy egyszerű mező csak akkor rendezhető, ha egyértékű (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez igaz, akár közvetlen szülőmezőről, akár ősmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és a rendezhető tulajdonságnak null értékűnek kell lennie az ilyen mezőkhöz. A rendezhető érték alapértelmezett értéke igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezők esetében pedig null értékre.

stored

boolean

Nem módosítható érték, amely azt jelzi, hogy a mező külön marad-e a lemezen, és a keresési eredményben lesz visszaadva. Letilthatja ezt a beállítást, ha nem tervezi visszaadni a mező tartalmát egy keresési válaszban, hogy a tárterület terhelésére mentsen. Ez csak az index létrehozásakor és csak vektormezők esetén állítható be. Ez a tulajdonság nem módosítható meglévő mezők esetében, és nem állítható be hamisként az új mezőkhöz. Ha a tulajdonság értéke hamis, akkor a "beolvasható" tulajdonságnak is hamisnak kell lennie. Ennek a tulajdonságnak igaznak vagy nem halmaznak kell lennie a kulcsmezők, az új mezők és a nem vektoros mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. A tulajdonság letiltása csökkenti az index tárolási követelményeit. Az alapértelmezett érték a vektormezők esetében igaz.

synonymMaps

string[]

A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimák leképezésének mezőhöz való hozzárendelése biztosítja, hogy a mezőre vonatkozó lekérdezési kifejezések lekérdezési időben ki legyenek bontva a szinonimatérkép szabályaival. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie.

type

SearchFieldDataType

A mező adattípusa.

vectorEncoding

VectorEncodingFormat

A mező tartalmának értelmezéséhez használt kódolási formátum.

vectorSearchProfile

string

A vektorkeresési profil neve, amely meghatározza a vektormezőben való kereséshez használni kívánt algoritmust és vektorizálót.

SearchFieldDataType

A keresési indexben lévő mezők adattípusát határozza meg.

Érték Description
Edm.Boolean

Azt jelzi, hogy egy mező logikai értéket tartalmaz (igaz vagy hamis).

Edm.Byte

Azt jelzi, hogy egy mező 8 bites, aláíratlan egész számot tartalmaz. Ez csak a Collection(Edm.Byte) használatakor érvényes.

Edm.ComplexType

Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek.

Edm.DateTimeOffset

Azt jelzi, hogy egy mező dátum/idő értéket tartalmaz, beleértve az időzónák adatait is.

Edm.Double

Azt jelzi, hogy egy mező IEEE kettős pontosságú lebegőpontos számot tartalmaz.

Edm.GeographyPoint

Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából.

Edm.Half

Azt jelzi, hogy egy mező fél pontosságú lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Half) használatakor érvényes.

Edm.Int16

Azt jelzi, hogy egy mező 16 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.Int16) használatakor érvényes.

Edm.Int32

Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz.

Edm.Int64

Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz.

Edm.SByte

Azt jelzi, hogy egy mező 8 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.SByte) használatakor érvényes.

Edm.Single

Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Single) használatakor érvényes.

Edm.String

Azt jelzi, hogy egy mező sztringet tartalmaz.

SearchIndex

A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését írja le.

Name Típus Description
@odata.etag

string

Az index ETagje.

analyzers LexicalAnalyzer[]:

Az index elemzői.

charFilters CharFilter[]:

Az index karakterszűrői.

corsOptions

CorsOptions

Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.

defaultScoringProfile

string

A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.

encryptionKey

SearchResourceEncryptionKey

Az Azure Key Vaultban létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes bizonyosságot szeretne arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal rendelkező titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.

fields

SearchField[]

Az index mezői.

name

string

Az index neve.

scoringProfiles

ScoringProfile[]

Az index pontozási profiljai.

semantic

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

similarity Similarity:

A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az index létrehozásakor definiálható, és a meglévő indexeken nem módosítható. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.

suggesters

Suggester[]

Az index javaslattevői.

tokenFilters TokenFilter[]:

Az index tokenszűrői.

tokenizers LexicalTokenizer[]:

Az index jogkivonat-szabályzói.

vectorSearch

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

SearchIndexerDataNoneIdentity

Törli az adatforrás identitástulajdonságát.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Az identitás típusát meghatározó URI-töredék.

SearchIndexerDataUserAssignedIdentity

Megadja a használni kívánt adatforrás identitását.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Az identitás típusát meghatározó URI-töredék.

userAssignedIdentity

string

A felhasználó által hozzárendelt felügyelt identitás teljes Azure-erőforrás-azonosítója általában "/subscriptions/12345678-1234-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" formában található, amelyet hozzá kellett volna rendelni a keresési szolgáltatáshoz.

SearchResourceEncryptionKey

Ügyfél által felügyelt titkosítási kulcs az Azure Key Vaultban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat, például indexeket és szinonimatérképeket.

Name Típus Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem kötelező, ha ehelyett felügyelt identitást használ.

keyVaultKeyName

string

A inaktív adatok titkosításához használandó Azure Key Vault-kulcs neve.

keyVaultKeyVersion

string

Az Azure Key Vault-kulcs inaktív adatok titkosításához használandó verziója.

keyVaultUri

string

Az Azure Key Vault URI-ja, más néven DNS-név, amely tartalmazza az inaktív adatok titkosításához használandó kulcsot. Példa URI lehet https://my-keyvault-name.vault.azure.net.

SemanticConfiguration

Meghatároz egy adott konfigurációt, amelyet a szemantikai képességek kontextusában kell használni.

Name Típus Description
name

string

A szemantikai konfiguráció neve.

prioritizedFields

PrioritizedFields

A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság (titleField, prioritizedKeywordsFields és prioritizedContentFields) közül legalább egyet be kell állítani.

SemanticField

A szemantikai konfiguráció részeként használt mező.

Name Típus Description
fieldName

string

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

Name Típus Description
configurations

SemanticConfiguration[]

Az index szemantikai konfigurációi.

defaultConfiguration

string

Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni.

ShingleTokenFilter

A jogkivonatok kombinációit egyetlen jogkivonatként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.ShingleTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

filterToken

string

_

A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_").

maxShingleSize

integer (int32)

minimum: 2
2

A maximális zsindelyméret. Az alapértelmezett és a minimális érték 2.

minShingleSize

integer (int32)

minimum: 2
2

A minimális zsindelyméret. Az alapértelmezett és a minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

outputUnigrams

boolean

True

Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és a zsindelyeket. Az alapértelmezett érték igaz.

outputUnigramsIfNoShingles

boolean

False

Egy érték, amely azt jelzi, hogy unigramokat kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre övsömör. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték hamis.

tokenSeparator

string

A szomszédos jogkivonatok összekapcsolásakor használandó sztring zsindely létrehozásához. Az alapértelmezett érték egy szóköz (" ").

SnowballTokenFilter

Egy szűrő, amely egy Snowball által létrehozott őslelő használatával szározza a szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.SnowballTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

language

SnowballTokenFilterLanguage

A használni kívánt nyelv.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

SnowballTokenFilterLanguage

A Snowball-jogkivonat-szűrőhöz használandó nyelv.

Érték Description
armenian

A Lucene Snowball örmény jogkivonat-jelölőt választja ki.

basque

Kiválasztja a Lucene Snowball szárító tokenizer baszk.

catalan

Kiválasztja a Lucene Snowball-t, amely a katalán jogkivonat-jelölőt tartalmazza.

danish

Kiválasztja a Lucene Snowball stemming tokenizer a dán.

dutch

Kiválasztja a Holland Lucene Snowball-jogkivonat-jelölőt.

english

Kiválasztja a Lucene Snowball stemming tokenizert angol nyelven.

finnish

Kiválasztja a Lucene Snowball stemming tokenizer for Finn.

french

Kiválasztja a Lucene Snowball szárító tokenizer a francia.

german

Kiválasztja a Lucene Snowball stemming tokenizer német.

german2

Kiválasztja a német variációs algoritmust használó Lucene Snowball-jogkivonat-készítőt.

hungarian

Kiválasztja a Lucene Snowball stemming tokenizer a magyar.

italian

Kiválasztja az olasz Lucene Snowball jogkivonat-jelölőt.

kp

Kiválasztja a Lucene Snowball származtatási tokenizert hollandul, amely a Kraaij-Pohlmann származtatási algoritmust használja.

lovins

Kiválasztja a Lovins-származtatási algoritmust használó angol lucene Snowball-jogkivonat-készítőt.

norwegian

Kiválasztja a Lucene Snowball stemming tokenizer a norvég.

porter

A Porter-származtatási algoritmust használó, angol nyelvhez készült Lucene Snowball-jogkivonat-készítőt választja ki.

portuguese

Kiválasztja a Lucene Snowball stemming tokenizer portugál.

romanian

Kiválasztja a Lucene Snowball stemming tokenizer a román.

russian

Kiválasztja a Lucene Snowball eredetjogkivonat-jelölőt az oroszhoz.

spanish

Kiválasztja a Lucene Snowball stemming tokenizer a spanyol.

swedish

Kiválasztja a Lucene Snowball stemming tokenizer svéd.

turkish

Kiválasztja a Lucene Snowball szárító tokenizer a török.

StemmerOverrideTokenFilter

Lehetővé teszi az egyéb eredetszűrők felülbírálását a saját szótáralapú szárzással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, hogy ne legyenek a láncban lévő ősökkel való eredetük. A szűrőt a szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.StemmerOverrideTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

rules

string[]

Az eredetszabályok listája a következő formátumban: "word => stem", például: "ran => run".

StemmerTokenFilter

Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.StemmerTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

language

StemmerTokenFilterLanguage

A használni kívánt nyelv.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

StemmerTokenFilterLanguage

A stemmer token szűrőhöz használandó nyelv.

Érték Description
arabic

Kiválasztja az arabhoz tartozó Lucene-jogkivonat-jelölőt.

armenian

Kiválasztja az örmény Lucene-jogkivonat-jelölőt.

basque

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a baszkhoz.

brazilian

Kiválasztja a lucene-i jogkivonat-jelölőt a portugál (Brazília) számára.

bulgarian

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a bolgárhoz.

catalan

Kiválasztja a lucene-i jogkivonat-jelölőt a katalánhoz.

czech

Kiválasztja a Lucene-alapú jogkivonat-kezelőt a csehhez.

danish

Kiválasztja a lucene-i jogkivonat-jelölőt a dánhoz.

dutch

Kiválasztja a Lucene-alapú jogkivonat-kezelőt a hollandhoz.

dutchKp

Kiválasztja a Lucene-származtatási tokenizert a hollandhoz, amely a Kraaij-Pohlmann származtatási algoritmust használja.

english

Kiválasztja a Lucene-alapú jogkivonat-kezelőt az angol nyelvhez.

finnish

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez.

french

Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt.

galician

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz.

german

Kiválasztja a lucene-i jogkivonat-jelölőt a némethez.

german2

Kiválasztja a német variációs algoritmust használó Lucene-alapú jogkivonat-készítőt.

greek

Kiválasztja a lucene-i jogkivonat-jelölőt a göröghöz.

hindi

Kiválasztja a Hindihez tartozó Lucene-jogkivonat-jelölőt.

hungarian

Kiválasztja a lucene-i jogkivonat-jelölőt a magyarhoz.

indonesian

Kiválasztja az indonéz Lucene-alapú jogkivonat-kezelőt.

irish

Kiválasztja az ír Lucene-alapú jogkivonat-jelölőt.

italian

Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt.

latvian

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a lett számára.

lightEnglish

Kiválasztja a Lucene stemming tokenizer for English, amely nem világos szárú.

lightFinnish

Kiválasztja a Lucene szárító tokenizer finn, hogy nem könnyű szárú.

lightFrench

Kiválasztja a Lucene szárító tokenizer a francia, hogy nem könnyű szárú.

lightGerman

Kiválasztja a lucene-i jogkivonat-jelölőt a némethez, amely világos szározást végez.

lightHungarian

Kiválasztja a lucene-i jogkivonat-jelölőt a magyarhoz, amely világos szárú.

lightItalian

Kiválasztja a Lucene szárító tokenizer az olasz, hogy nem könnyű szárú.

lightNorwegian

Kiválasztja a Lucene stemming tokenizer a norvég (Bokmål), amely nem könnyű stemming.

lightNynorsk

Kiválasztja a Lucene stemming tokenizer a norvég (Nynorsk), amely nem könnyű szárú.

lightPortuguese

Kiválasztja a Lucene szárító tokenizer portugál, hogy nem könnyű szárú.

lightRussian

Kiválasztja a Lucene szárító tokenizer az orosz, hogy nem könnyű stemming.

lightSpanish

Kiválasztja a Lucene szárító tokenizer a spanyol, hogy nem könnyű szárú.

lightSwedish

Kiválasztja a Lucene stemming tokenizer svéd, hogy nem könnyű szárú.

lovins

Kiválasztja a Lovins-származtatási algoritmust használó angol Lucene-jogkivonat-készítőt.

minimalEnglish

Kiválasztja a Lucene stemming tokenizert az angolhoz, amely minimálisan hajtja ki azokat.

minimalFrench

Kiválasztja a Lucene szárító tokenizer a francia, hogy nem minimális stemming.

minimalGalician

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz, amely minimális szározást végez.

minimalGerman

Kiválasztja a lucene-alapú jogkivonat-jelölőt a némethez, amely minimálisan szározza a elemet.

minimalNorwegian

Kiválasztja a Lucene szárító tokenizer a norvég (Bokmål), hogy nem minimális szárítás.

minimalNynorsk

Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely minimális szárítást végez.

minimalPortuguese

Kiválasztja a lucene-i jogkivonat-jelölőt a portugálhoz, amely minimális szárítást végez.

norwegian

Kiválasztja a Lucene stemming tokenizer for Norwegian (Bokmål).

porter2

Kiválasztja a Porter2 stemming algoritmust használó angol lucene-alapú jogkivonat-készítőt.

portuguese

Kiválasztja a lucene-i jogkivonat-jelölőt a portugálhoz.

portugueseRslp

Kiválasztja az RSLP-alapú származtatási algoritmust használó portugál Lucene-jogkivonat-készítőt.

possessiveEnglish

Kiválasztja az angol nyelvhez tartozó Lucene-jogkivonat-jelölőt, amely eltávolítja a záró birtokosokat a szavakból.

romanian

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a román nyelvhez.

russian

Kiválasztja az orosz Lucene-alapú jogkivonat-jelölőt.

sorani

A Soranihoz tartozó Lucene-jogkivonat-jelölő kiválasztása.

spanish

Kiválasztja a lucene-i jogkivonat-jelölőt a spanyolhoz.

swedish

Kiválasztja a Lucene stemming tokenizer svéd.

turkish

Kiválasztja a Lucene-alapú jogkivonat-kezelőt a törökhöz.

StopAnalyzer

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.StopAnalyzer

Az elemző típusát meghatározó URI-töredék.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

stopwords

string[]

A stopwords listája.

StopwordsList

A nyelvspecifikus stopszavak előre definiált listáját azonosítja.

Érték Description
arabic

Kiválasztja az arab nyelvű stopword listát.

armenian

Kiválasztja az örmény nyelvű stopword listát.

basque

Kiválasztja a baszk stopword listát.

brazilian

Kiválasztja a portugál (Brazília) stopword listát.

bulgarian

Kiválasztja a bolgár nyelvű stopword listát.

catalan

Kiválasztja a katalán stopword listát.

czech

Kiválasztja a cseh stopword listát.

danish

Kiválasztja a dán nyelvű stopword listát.

dutch

Kiválasztja a holland stopword listát.

english

Kiválasztja az angol nyelvű stopword listát.

finnish

Kiválasztja a finn nyelvű stopword listát.

french

Kiválasztja a francia nyelvű stopword listát.

galician

Kiválasztja a galíciai stopword listát.

german

A német nyelvhez tartozó stopword listát választja ki.

greek

Kiválasztja a göröghöz tartozó stopword listát.

hindi

Kiválasztja a Hindihez tartozó stopword listát.

hungarian

Kiválasztja a magyar nyelvű stopword listát.

indonesian

Kiválasztja az indonéz stopword listát.

irish

Kiválasztja az írek stopword listáját.

italian

Kiválasztja az olasz nyelvű stopword listát.

latvian

Kiválasztja a lett stopword listát.

norwegian

Kiválasztja a norvég nyelvhez tartozó stopword listát.

persian

Kiválasztja a perzsa stopword listát.

portuguese

Kiválasztja a portugál stopword listát.

romanian

Kiválasztja a román nyelvű stopword listát.

russian

Kiválasztja az orosz nyelvű stopword listát.

sorani

A Sorani stopword listájának kiválasztása.

spanish

Kiválasztja a spanyol nyelvű stopword listát.

swedish

Kiválasztja a svéd stopword listát.

thai

Kiválasztja a thai nyelvhez tartozó stopword listát.

turkish

Kiválasztja a törökhöz tartozó stopword listát.

StopwordsTokenFilter

Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StopwordsTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

ignoreCase

boolean

False

A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték hamis.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

removeTrailing

boolean

True

Egy érték, amely azt jelzi, hogy figyelmen kívül kell-e hagyni az utolsó keresési kifejezést, ha az egy stop szó. Az alapértelmezett érték igaz.

stopwords

string[]

A stopwords listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be.

stopwordsList

StopwordsList

english

A használni kívánt stopwords előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol.

Suggester

Meghatározza, hogyan kell alkalmazni a Javaslat API-t az index egy mezőcsoportjára.

Name Típus Description
name

string

A javaslattevő neve.

searchMode

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

sourceFields

string[]

Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie.

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

Érték Description
analyzingInfixMatching

Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "gyors" és a "leggyorsabb szemöldök" lekérdezések is egyeznek.

SynonymTokenFilter

Egy vagy többszavas szinonimák egy jogkivonat-streamben. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.SynonymTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

expand

boolean

True

Egy érték, amely jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nem használatos) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha => jelölés nem használatos) megfeleltethető egymással. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Az alapértelmezett érték igaz.

ignoreCase

boolean

False

Egy érték, amely azt jelzi, hogy a kis- és nagybetűs bemenet egyezésre van-e behajtva. Az alapértelmezett érték hamis.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

synonyms

string[]

A szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - az => szimbólum bal oldalán lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés lép; 2. hihetetlen, hihetetlen, mesés, csodálatos - vesszővel elválasztott lista egyenértékű szavak. A kibontás beállításával módosíthatja a lista értelmezését.

TagScoringFunction

Olyan függvényt határoz meg, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.

Name Típus Description
boost

number (double)

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris".

tag

TagScoringParameters

A címkepontozási függvény paraméterértékei.

type string:

tag

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

TagScoringParameters

Paraméterértékeket biztosít egy címkepontozási függvénynek.

Name Típus Description
tagsParameter

string

A keresési lekérdezésekben átadott paraméter neve, amely megadja a célmezővel összehasonlítandó címkék listáját.

TextWeights

Olyan indexmezők súlyozását határozza meg, amelyek esetében az egyezéseknek növelnie kell a keresési lekérdezések pontozását.

Name Típus Description
weights

object

A mezőnkénti súlyok szótára a dokumentumpontszámozás növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai.

TokenCharacterKind

Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.

Érték Description
digit

A számjegyeket jogkivonatokban tárolja.

letter

A betűket jogkivonatokban tárolja.

punctuation

Az írásjelek a tokenekben maradnak.

symbol

A szimbólumokat jogkivonatokban tárolja.

whitespace

Jogkivonatokban tartja a whitespace-t.

TokenFilterName

Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.

Érték Description
apostrophe

Az aposztróf után az összes karaktert (beleértve magát az aposztrófot is) csíkoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

arabic_normalization

Jogkivonatszűrő, amely az arab normalizálót alkalmazza az ortográfia normalizálására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

asciifolding

Az első 127 ASCII-karakterben nem szereplő betűrendes, numerikus és szimbolikus Unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja, ha léteznek ilyenek. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

A standard tokenizerből létrehozott CJK-kifejezések bigramjai. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

Normalizálja a CJK szélességi különbségeit. A teljes körű ASCII-variánsokat a megfelelő egyszerű latin és félszélességű Katakana-változatokra hajtja a megfelelő Kana-ra. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

Eltávolítja az angol birtokosokat és a betűszókat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

Eltávolítja az elisionst. A "l'avion" (a sík) például "avion" (sík) lesz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

Normalizálja a német karaktereket a német2 hógolyó algoritmus heurisztikusai szerint. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

Normalizálja a hindi szövegeket, hogy eltávolítson néhány különbséget a helyesírási változatokban. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

Normalizálja a szöveg Unicode-ábrázolását indiai nyelveken. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

Minden bejövő jogkivonatot kétszer bocsát ki, egyszer kulcsszóként, egyszer pedig nem kulcsszóként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

Nagy teljesítményű kstem szűrő angol nyelven. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

Eltávolítja a túl hosszú vagy túl rövid szavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

Korlátozza a jogkivonatok számát az indexelés során. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

A jogkivonat szövegének normalizálása kisbetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

A megadott méret(ek) n grammját hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

A perzsa normalizálását alkalmazza. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

Jogkivonatok létrehozása fonetikus egyezésekhez. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

A Porter-származtatási algoritmussal átalakítja a jogkivonat-adatfolyamot. Lásd: http://tartarus.org/~martin/PorterStemmer

reverse

A jogkivonat sztringjének megfordítása. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_folding

Folds skandináv karakterek åÅäæÄÆ->a és öÖøØ->o. Emellett megkülönbözteti a dupla magánhangzók aa, ae, ao, oe és oo használatát, így csak az első. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

scandinavian_normalization

Normalizálja a felcserélhető skandináv karakterek használatát. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

shingle

A jogkivonatok kombinációit egyetlen jogkivonatként hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

Egy szűrő, amely egy Snowball által létrehozott őslelő használatával szározza a szavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

Normalizálja a Sorani-szöveg Unicode-ábrázolását. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

Nyelvspecifikus eredetszűrő. Lásd: https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

Levágja a kezdő és a záró szóközt a jogkivonatokból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

A kifejezéseket egy adott hosszra csonkolja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

Kiszűri a jogkivonatokat ugyanazzal a szöveggel, mint az előző jogkivonat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

A jogkivonat szövegének normalizálása nagybetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszavas csoportokon.

TruncateTokenFilter

A kifejezéseket egy adott hosszra csonkolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.TruncateTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

length

integer (int32)

maximum: 300
300

A kifejezés csonkításának hossza. Az alapértelmezett érték és a maximális érték 300.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UaxUrlEmailTokenizer

Tokenizes URL-címek és e-mailek egy jogkivonatként. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.UaxUrlEmailTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer (int32)

maximum: 300
255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UniqueTokenFilter

Kiszűri a jogkivonatokat ugyanazzal a szöveggel, mint az előző jogkivonat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.UniqueTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

onlyOnSamePosition

boolean

False

Egy érték, amely azt jelzi, hogy csak ugyanazon a helyen szeretné-e eltávolítani az ismétlődéseket. Az alapértelmezett érték hamis.

VectorEncodingFormat

A vektormező tartalmának értelmezéséhez használt kódolási formátum.

Érték Description
packedBit

A szélesebb adattípusba csomagolt biteket ábrázoló kódolási formátum.

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

Name Típus Description
algorithms VectorSearchAlgorithmConfiguration[]:

Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz.

compressions VectorSearchCompressionConfiguration[]:

Az indexelés vagy lekérdezés során használt tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.

profiles

VectorSearchProfile[]

A vektorkereséshez használandó konfigurációk kombinációit határozza meg.

vectorizers VectorSearchVectorizer[]:

A szöveges vektoros lekérdezések vektorizálására vonatkozó konfigurációs beállításokat tartalmaz.

VectorSearchAlgorithmKind

Az indexeléshez és lekérdezéshez használt algoritmus.

Érték Description
exhaustiveKnn

Teljes körű KNN-algoritmus, amely találgatásos keresést hajt végre.

hnsw

HNSW (Hierarchikus Navigable Small World), a legközelebbi szomszéd algoritmus típusa.

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, mint a beágyazási modell betanítása.

Érték Description
cosine

A vektorok közötti szöget méri a hasonlóságuk számszerűsítéséhez, figyelmen kívül hagyva a nagyságrendet. Minél kisebb a szög, annál közelebb van a hasonlóság.

dotProduct

Kiszámítja az elemalapú termékek összegét az igazítás és a nagyságrendi hasonlóság méréséhez. Minél nagyobb és pozitívabb, annál közelebb van a hasonlóság.

euclidean

Kiszámítja a vektorok közötti egyenes egyenes távolságot egy többdimenziós térben. Minél kisebb a távolság, annál közelebb van a hasonlóság.

hamming

Csak bitcsomagolt bináris adattípusokra alkalmazható. Az eltérőséget a bináris vektorok eltérő pozícióinak megszámolásával határozza meg. Minél kevesebb a különbség, annál közelebb van a hasonlóság.

VectorSearchCompressionKind

Az indexeléshez és lekérdezéshez használt tömörítési módszer.

Érték Description
binaryQuantization

Bináris kvantálás, a tömörítési módszer típusa. A bináris kvantálás során az eredeti vektorértékek a szűkebb bináris típusba lesznek tömörítve a vektor egyes összetevőinek bináris értékekkel való megkülönböztetésével és ábrázolásával, ezáltal csökkentve a teljes adatméretet.

scalarQuantization

Skaláris kvantálás, a tömörítési módszer típusa. A skaláris kvantálás során az eredeti vektorértékek szűkebb típusba vannak tömörítve a vektorok egyes összetevőinek megkülönböztetésével és megjelenítésével csökkentett kvantált értékek használatával, ezáltal csökkentve a teljes adatméretet.

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

Érték Description
int8

VectorSearchProfile

A vektorkereséssel használható konfigurációk kombinációját határozza meg.

Name Típus Description
algorithm

string

A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket.

compression

string

A tömörítési metódus konfigurációjának neve, amely megadja a tömörítési módszert és az opcionális paramétereket.

name

string

Az adott vektorkeresési profilhoz társítandó név.

vectorizer

string

A vektorkereséshez konfigurált vektorizáció neve.

VectorSearchVectorizerKind

A lekérdezési idő alatt használandó vektorizációs módszer.

Érték Description
azureOpenAI

Beágyazásokat hozhat létre egy Azure OpenAI-erőforrás használatával lekérdezéskor.

customWebApi

Beágyazások létrehozása egyéni webes végpont használatával lekérdezéskor.

WebApiParameters

Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.

Name Típus Description
authIdentity SearchIndexerDataIdentity:

A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Az indexelő frissítéseinél, ha az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik.

authResourceId

string

Olyan egyéni végpontokra vonatkozik, amelyek külső kódhoz csatlakoznak egy Azure-függvényben, vagy más olyan alkalmazásra, amely az átalakításokat biztosítja. Ennek az értéknek a függvényhez vagy alkalmazáshoz az Azure Active Directoryban való regisztráláskor létrehozott alkalmazásazonosítónak kell lennie. Ha meg van adva, a vektorizálás a keresési szolgáltatás felügyelt azonosítójával (rendszer vagy felhasználó által hozzárendelt) és a függvény vagy alkalmazás hozzáférési jogkivonatával csatlakozik a függvényhez vagy alkalmazáshoz, és ezt az értéket használja erőforrás-azonosítóként a hozzáférési jogkivonat hatókörének létrehozásához.

httpHeaders

object

A HTTP-kérés végrehajtásához szükséges fejlécek.

httpMethod

string

A HTTP-kérés metódusa.

timeout

string (duration)

A kérés kívánt időtúllépése. Az alapértelmezett érték 30 másodperc.

uri

string (uri)

A vektorizálót biztosító webes API URI-ja.

WebApiVectorizer

Felhasználó által definiált vektorizálót ad meg a lekérdezési sztring vektorbeágyazásához. A külső vektorizáló integrálása egy készségkészlet egyéni webes API-felületével érhető el.

Name Típus Description
customWebApiParameters

WebApiParameters

A felhasználó által definiált vektorizáló tulajdonságait adja meg.

kind string:

customWebApi

A vektorkereséshez konfigurált vektorizációs módszer neve.

name

string

Az adott vektorizálási metódushoz társítandó név.

WordDelimiterTokenFilter

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.WordDelimiterTokenFilter

Egy URI-töredék, amely megadja a jogkivonatszűrő típusát.

catenateAll

boolean

False

Egy érték, amely azt jelzi, hogy az összes alszavas rész be lesz-e jelölve. Ha például ez igaz értékre van állítva, az "Azure-Search-1" lesz az "AzureSearch1". Az alapértelmezett érték hamis.

catenateNumbers

boolean

False

Egy érték, amely azt jelzi, hogy a számrészek maximális futását a rendszer elvégzi-e. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték hamis.

catenateWords

boolean

False

Egy érték, amely azt jelzi, hogy a szórészek maximális futása ki lesz-e jelölve. Ha például ez igaz értékre van állítva, az "Azure-Search" az "AzureSearch" lesz. Az alapértelmezett érték hamis.

generateNumberParts

boolean

True

Szám alszavainak generálását jelző érték. Az alapértelmezett érték igaz.

generateWordParts

boolean

True

Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak egyes részei létrejönnek; például az "AzureSearch" "Azure" "Search" lesz. Az alapértelmezett érték igaz.

name

string

A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

preserveOriginal

boolean

False

Egy érték, amely jelzi, hogy az eredeti szavak megmaradnak-e, és hozzáadva lesznek-e az alszavak listájához. Az alapértelmezett érték hamis.

protectedWords

string[]

A tagolástól védendő jogkivonatok listája.

splitOnCaseChange

boolean

True

Egy érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange-en. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Search" lesz. Az alapértelmezett érték igaz.

splitOnNumerics

boolean

True

Érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Search" lesz. Az alapértelmezett érték igaz.

stemEnglishPossessive

boolean

True

Egy érték, amely jelzi, hogy el szeretné-e távolítani az egyes alszavak záró "'s"-jét. Az alapértelmezett érték igaz.