Indexers - Get
Lekéri az indexelő definícióját.
GET {endpoint}/indexers('{indexerName}')?api-version=2024-07-01
URI-paraméterek
Name | In | Kötelező | Típus | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
A keresési szolgáltatás végponti URL-címe. |
indexer
|
path | True |
string |
A lekérni kívánt indexelő neve. |
api-version
|
query | True |
string |
Ügyfél API-verziója. |
Kérelem fejléce
Name | Kötelező | Típus | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben. |
Válaszok
Name | Típus | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Hibaválasz. |
Példák
SearchServiceGetIndexer
Mintakérelem
GET https://myservice.search.windows.net/indexers('myindexer')?api-version=2024-07-01
Mintaválasz
{
"name": "myindexer",
"description": "a cool indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"fieldMappings": [],
"disabled": false,
"encryptionKey": {
"keyVaultKeyName": "myKeyName",
"keyVaultKeyVersion": "myKeyVersion",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
Definíciók
Name | Description |
---|---|
Azure |
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyeket az Azure Key Vaultban tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak. |
Blob |
Megadja az Azure Blob Storage-ból kinyerni kívánt adatokat, és közli az indexelővel, hogy mely adatokat kell kinyerni a képtartalomból, ha az "imageAction" értéke nem "none". Ez egy .PDF vagy más alkalmazás beágyazott képtartalmaira, illetve az Azure-blobokban lévő képfájlokra, például .jpg és .pngvonatkozik. |
Blob |
Meghatározza, hogyan dolgozhatja fel a beágyazott képeket és képfájlokat az Azure Blob Storage-ban. Ha az "imageAction" konfigurációt a "none" értéken kívül más értékre állítja be, egy képességkészletet is hozzá kell csatolni az indexelőhöz. |
Blob |
Az Azure Blob-adatforrásból történő indexelés elemzési módját jelöli. |
Blob |
Meghatározza az Azure Blob Storage-beli PDF-fájlokból való szövegkivétel algoritmusát. |
Error |
Az erőforrás-kezelési hiba további információi. |
Error |
A hiba részletei. |
Error |
Hibaválasz |
Field |
Egy adatforrás mezője és egy index célmezője közötti leképezést definiál. |
Field |
Olyan függvényt jelöl, amely az indexelés előtt átalakít egy értéket egy adatforrásból. |
Indexer |
Azt a környezetet adja meg, amelyben az indexelőnek végre kell hajtania. |
Indexing |
Az indexelő végrehajtásának paramétereit jelöli. |
Indexing |
Indexelőspecifikus konfigurációs tulajdonságok szótára. Minden név egy adott tulajdonság neve. Minden értéknek primitív típusúnak kell lennie. |
Indexing |
Az indexelő végrehajtásának ütemezését jelöli. |
Search |
Indexelőt jelöl. |
Search |
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vaultban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat, például indexeket és szinonimatérképeket. |
AzureActiveDirectoryApplicationCredentials
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyeket az Azure Key Vaultban tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.
Name | Típus | Description |
---|---|---|
applicationId |
string |
Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vaulthoz, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával. |
applicationSecret |
string |
A megadott AAD-alkalmazás hitelesítési kulcsa. |
BlobIndexerDataToExtract
Megadja az Azure Blob Storage-ból kinyerni kívánt adatokat, és közli az indexelővel, hogy mely adatokat kell kinyerni a képtartalomból, ha az "imageAction" értéke nem "none". Ez egy .PDF vagy más alkalmazás beágyazott képtartalmaira, illetve az Azure-blobokban lévő képfájlokra, például .jpg és .pngvonatkozik.
Name | Típus | Description |
---|---|---|
allMetadata |
string |
Kinyeri az Azure Blob Storage alrendszer által biztosított metaadatokat és a tartalomtípus-specifikus metaadatokat (például a csak .png fájlokra jellemző metaadatokat indexeli). |
contentAndMetadata |
string |
Kinyeri az összes metaadatot és szöveges tartalmat az egyes blobokból. |
storageMetadata |
string |
Csak a standard blobtulajdonságokat és a felhasználó által megadott metaadatokat indexeli. |
BlobIndexerImageAction
Meghatározza, hogyan dolgozhatja fel a beágyazott képeket és képfájlokat az Azure Blob Storage-ban. Ha az "imageAction" konfigurációt a "none" értéken kívül más értékre állítja be, egy képességkészletet is hozzá kell csatolni az indexelőhöz.
Name | Típus | Description |
---|---|---|
generateNormalizedImagePerPage |
string |
Kinyeri a képek szövegét (például a "STOP" szót egy forgalommegállási jelből), és beágyazza a tartalommezőbe, de másképp kezeli a PDF-fájlokat, mivel minden oldal képként jelenik meg, és ennek megfelelően normalizálódik a beágyazott képek kinyerése helyett. A nem PDF-fájltípusok ugyanúgy lesznek kezelve, mintha a "generateNormalizedImages" beállítás lett volna beállítva. |
generateNormalizedImages |
string |
Kinyeri a képek szövegét (például a "STOP" szót egy forgalom-leállítási jelből), és beágyazza a tartalommezőbe. Ehhez a művelethez a "dataToExtract" értéke "contentAndMetadata". A normalizált kép olyan további feldolgozást jelent, amely egységes képkimenetet eredményez, méretezve és elforgatva, hogy elősegítse a következetes renderelést, amikor képeket ad meg a vizuális keresési eredményekben. Ez az információ minden képhez létrejön, amikor ezt a beállítást használja. |
none |
string |
Figyelmen kívül hagyja a beágyazott képeket vagy képfájlokat az adatkészletben. Ez az alapértelmezett érték. |
BlobIndexerParsingMode
Az Azure Blob-adatforrásból történő indexelés elemzési módját jelöli.
Name | Típus | Description |
---|---|---|
default |
string |
Normál fájlfeldolgozás esetén állítsa be az alapértelmezett értéket. |
delimitedText |
string |
Ha a blobok egyszerű CSV-fájlok, akkor az elhatároltText értékre van állítva. |
json |
string |
A JSON-fájlokból strukturált tartalom kinyeréséhez állítsa be a json értéket. |
jsonArray |
string |
A JSON-tömb egyes elemeinek különálló dokumentumokként való kinyeréséhez állítsa be a jsonArray értéket. |
jsonLines |
string |
A jsonLines értékre állítva az egyes JSON-entitásokat egy új sor választja el egymástól, különálló dokumentumokként. |
text |
string |
A blobtárolóban lévő egyszerű szöveges fájlok indexelési teljesítményének javításához állítsa be a szöveget szövegre. |
BlobIndexerPDFTextRotationAlgorithm
Meghatározza az Azure Blob Storage-beli PDF-fájlokból való szövegkivétel algoritmusát.
Name | Típus | Description |
---|---|---|
detectAngles |
string |
Jobb és olvashatóbb szövegkinyeréseket eredményezhet olyan PDF-fájlokból, amelyekben elforgatott szöveg található. Vegye figyelembe, hogy ennek a paraméternek a használata kis teljesítménysebesség-hatással járhat. Ez a paraméter csak PDF-fájlokra vonatkozik, és csak beágyazott szöveggel rendelkező PDF-fájlokra. Ha az elforgatott szöveg egy beágyazott képben jelenik meg a PDF-ben, ez a paraméter nem érvényes. |
none |
string |
A normál szövegkiemelést használja. Ez az alapértelmezett érték. |
ErrorAdditionalInfo
Az erőforrás-kezelési hiba további információi.
Name | Típus | Description |
---|---|---|
info |
object |
A további információk. |
type |
string |
A további információtípus. |
ErrorDetail
A hiba részletei.
Name | Típus | Description |
---|---|---|
additionalInfo |
A hiba további információi. |
|
code |
string |
A hibakód. |
details |
A hiba részletei. |
|
message |
string |
A hibaüzenet. |
target |
string |
A hibacél. |
ErrorResponse
Hibaválasz
Name | Típus | Description |
---|---|---|
error |
A hibaobjektum. |
FieldMapping
Egy adatforrás mezője és egy index célmezője közötti leképezést definiál.
Name | Típus | Description |
---|---|---|
mappingFunction |
Az indexelés előtt az egyes forrásmezőértékekre alkalmazandó függvény. |
|
sourceFieldName |
string |
Az adatforrás mezőjének neve. |
targetFieldName |
string |
Az index célmezőjének neve. Alapértelmezés szerint megegyezik a forrásmező nevével. |
FieldMappingFunction
Olyan függvényt jelöl, amely az indexelés előtt átalakít egy értéket egy adatforrásból.
Name | Típus | Description |
---|---|---|
name |
string |
A mezőleképezési függvény neve. |
parameters |
object |
A függvénynek átadni kívánt paraméternév-érték párok szótára. Minden értéknek primitív típusúnak kell lennie. |
IndexerExecutionEnvironment
Azt a környezetet adja meg, amelyben az indexelőnek végre kell hajtania.
Name | Típus | Description |
---|---|---|
private |
string |
Azt jelzi, hogy az indexelőnek a kifejezetten a keresési szolgáltatáshoz kiépített környezettel kell futnia. Ez csak akkor adható meg végrehajtási környezetként, ha az indexelőnek biztonságosan kell hozzáférnie az erőforrásokhoz megosztott privát kapcsolati erőforrásokon keresztül. |
standard |
string |
Azt jelzi, hogy a keresési szolgáltatás meghatározhatja, hogy az indexelő hol hajtson végre. Ez az alapértelmezett környezet, ha nincs megadva semmi, és ez az ajánlott érték. |
IndexingParameters
Az indexelő végrehajtásának paramétereit jelöli.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
batchSize |
integer |
Az adatforrásból beolvasott és egyetlen kötegként indexelt elemek száma a teljesítmény javítása érdekében. Az alapértelmezett érték az adatforrás típusától függ. |
|
configuration |
Indexelőspecifikus konfigurációs tulajdonságok szótára. Minden név egy adott tulajdonság neve. Minden értéknek primitív típusúnak kell lennie. |
||
maxFailedItems |
integer |
0 |
Az indexelő végrehajtásához sikertelen indexelést meghiúsuló elemek maximális száma továbbra is sikeresnek tekinthető. -1 azt jelenti, hogy nincs korlát. Az alapértelmezett érték 0. |
maxFailedItemsPerBatch |
integer |
0 |
Az egyetlen köteg azon elemeinek maximális száma, amelyek sikertelen indexelést okozhatnak ahhoz, hogy a köteg továbbra is sikeresnek minősüljön. -1 azt jelenti, hogy nincs korlát. Az alapértelmezett érték 0. |
IndexingParametersConfiguration
Indexelőspecifikus konfigurációs tulajdonságok szótára. Minden név egy adott tulajdonság neve. Minden értéknek primitív típusúnak kell lennie.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
allowSkillsetToReadFileData |
boolean |
False |
Ha igaz, létrehoz egy elérési utat //document//file_data, amely a blob adatforrásából letöltött eredeti fájladatokat képviselő objektum. Ez lehetővé teszi az eredeti fájladatok átadását egy egyéni képességnek a bővítési folyamaton belüli feldolgozáshoz, vagy a Dokumentumkinyerési képességnek. |
dataToExtract | contentAndMetadata |
Megadja az Azure Blob Storage-ból kinyerni kívánt adatokat, és közli az indexelővel, hogy mely adatokat kell kinyerni a képtartalomból, ha az "imageAction" értéke nem "none". Ez egy .PDF vagy más alkalmazás beágyazott képtartalmaira, illetve az Azure-blobokban lévő képfájlokra, például .jpg és .pngvonatkozik. |
|
delimitedTextDelimiter |
string |
CSV-blobok esetén az egykarakteres elválasztó karaktert adja meg azokhoz a CSV-fájlokhoz, ahol minden sor új dokumentumot indít el (például "|"). |
|
delimitedTextHeaders |
string |
CSV-blobok esetén az oszlopfejlécek vesszővel tagolt listáját adja meg, amely hasznos lehet az index célmezőihez való leképezéséhez. |
|
documentRoot |
string |
JSON-tömbök esetén, strukturált vagy részben strukturált dokumentum esetén a tulajdonság használatával megadhatja a tömb elérési útját. |
|
excludedFileNameExtensions |
string |
Az Azure Blob Storage-ból történő feldolgozáskor figyelmen kívül hagyandó fájlnévkiterjesztések vesszőkkel tagolt listája. Kizárhatja például a ".png, .mp4" lehetőséget, hogy átugorja ezeket a fájlokat az indexelés során. |
|
executionEnvironment | standard |
Azt a környezetet adja meg, amelyben az indexelőnek végre kell hajtania. |
|
failOnUnprocessableDocument |
boolean |
False |
Az Azure-blobok esetében állítsa hamis értékre, ha folytatni szeretné az indexelést, ha egy dokumentum indexelése sikertelen. |
failOnUnsupportedContentType |
boolean |
False |
Az Azure-blobok esetében állítsa hamis értékre, ha nem támogatott tartalomtípus esetén szeretné folytatni az indexelést, és nem ismeri előre az összes tartalomtípust (fájlkiterjesztést). |
firstLineContainsHeaders |
boolean |
True |
CSV-blobok esetén az egyes blobok első (nem üres) sora fejléceket tartalmaz. |
imageAction | none |
Meghatározza, hogyan dolgozhatja fel a beágyazott képeket és képfájlokat az Azure Blob Storage-ban. Ha az "imageAction" konfigurációt a "none" értéken kívül más értékre állítja be, egy képességkészletet is hozzá kell csatolni az indexelőhöz. |
|
indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
Azure-blobok esetén állítsa ezt a tulajdonságot igaz értékre, hogy továbbra is indexelje a tárolási metaadatokat olyan blobtartalmak esetében, amelyek túl nagyok a feldolgozáshoz. A túlméretezett blobokat alapértelmezés szerint hibaként kezeli a rendszer. A blob méretkorlátjaiért lásd: https://learn.microsoft.com/azure/search/search-limits-quotas-capacity. |
indexedFileNameExtensions |
string |
Az Azure Blob Storage-ból történő feldolgozáskor kiválasztandó fájlnévkiterjesztések vesszőkkel tagolt listája. A ".docx, .pptx, .msg" alkalmazásfájlok indexelésével például kifejezetten belefoglalhatja ezeket a fájltípusokat. |
|
parsingMode | default |
Az Azure Blob-adatforrásból történő indexelés elemzési módját jelöli. |
|
pdfTextRotationAlgorithm | none |
Meghatározza az Azure Blob Storage-beli PDF-fájlokból való szövegkivétel algoritmusát. |
|
queryTimeout |
string |
00:05:00 |
Növeli az időtúllépést az "hh:mm:ss" formátumban megadott Azure SQL Database-adatforrások esetében az 5 perces alapértelmezettnél. |
IndexingSchedule
Az indexelő végrehajtásának ütemezését jelöli.
Name | Típus | Description |
---|---|---|
interval |
string |
Az indexelő végrehajtásai közötti időintervallum. |
startTime |
string |
Az az idő, amikor egy indexelőnek futnia kell. |
SearchIndexer
Indexelőt jelöl.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.etag |
string |
Az indexelő ETagje. |
|
dataSourceName |
string |
Annak az adatforrásnak a neve, amelyből az indexelő adatokat olvas be. |
|
description |
string |
Az indexelő leírása. |
|
disabled |
boolean |
False |
Érték, amely jelzi, hogy az indexelő le van-e tiltva. Az alapértelmezett érték hamis. |
encryptionKey |
Az Azure Key Vaultban létrehozott titkosítási kulcs leírása. Ez a kulcs további inaktív titkosítási szintet biztosít az indexelő definíciójához (valamint az indexelő végrehajtási állapotához), ha teljes bizonyosságot szeretne arról, hogy senki, még a Microsoft sem tudja visszafejteni őket. Miután titkosította az indexelő definícióját, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az indexelő definíciója (és az indexelő végrehajtási állapota) nem lesz hatással. Az ügyfél által felügyelt kulcsokkal rendelkező titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el. |
||
fieldMappings |
Az adatforrás mezői és az index megfelelő célmezői közötti leképezéseket határozza meg. |
||
name |
string |
Az indexelő neve. |
|
outputFieldMappings |
A kimeneti mezőleképezések a bővítés után és közvetlenül az indexelés előtt lesznek alkalmazva. |
||
parameters |
Az indexelő végrehajtásának paraméterei. |
||
schedule |
Az indexelő ütemezése. |
||
skillsetName |
string |
Az indexelővel végrehajtó képességkészlet neve. |
|
targetIndexName |
string |
Annak az indexnek a neve, amelyre az indexelő adatokat ír. |
SearchResourceEncryptionKey
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vaultban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat, például indexeket és szinonimatérképeket.
Name | Típus | Description |
---|---|---|
accessCredentials |
Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem kötelező, ha ehelyett felügyelt identitást használ. |
|
keyVaultKeyName |
string |
A inaktív adatok titkosításához használandó Azure Key Vault-kulcs neve. |
keyVaultKeyVersion |
string |
Az Azure Key Vault-kulcs inaktív adatok titkosításához használandó verziója. |
keyVaultUri |
string |
Az Azure Key Vault URI-ja, más néven DNS-név, amely tartalmazza az inaktív adatok titkosításához használandó kulcsot. Példa URI lehet |