Szövegegyesítési kognitív képesség
A Szövegegyesítés képesség sztringtömbből egyetlen mezőbe összesíti a szöveget.
Feljegyzés
Ez a képesség nem kötődik az Azure AI-szolgáltatásokhoz. Nem számlázható, és nincs Azure AI-szolgáltatások kulcskövetelménye.
@odata.type
Microsoft.Skills.Text.MergeSkill
Képességparaméterek
A paraméterek megkülönböztetik a kis- és nagybetűket.
Paraméter neve | Leírás |
---|---|
insertPreTag |
Minden beszúrás előtt belefoglalandó sztring. Az alapértelmezett érték " " . A szóköz kihagyásához állítsa az értéket a következőre "" : . |
insertPostTag |
Minden beszúrás után belefoglalandó sztring. Az alapértelmezett érték " " . A szóköz kihagyásához állítsa az értéket a következőre "" : . |
Készségbemenetek
Bemeneti név | Leírás |
---|---|
itemsToInsert |
Egyesítendő sztringek tömbje. |
text |
(nem kötelező) A beszúrandó fő szövegtörzs. Ha text nincs megadva, a itemsToInsert rendszer összefűzi az elemeket. |
offsets |
(nem kötelező) A beszúrandó pozíciók text itemsToInsert tömbje. Ha meg van adva, az elemek számának text meg kell egyenlnie az elemek számával textToInsert . Ellenkező esetben az összes elem hozzá lesz fűzve a sor végén text . |
Képességkimenetek
Kimeneti név | Leírás |
---|---|
mergedText |
Az eredményül kapott egyesített szöveg. |
mergedOffsets |
Olyan pozíciók mergedText tömbje, amelyek elemeit itemsToInsert beszúrták. |
Példabemenet
Ehhez a képességhez használható bemenetet biztosító JSON-dokumentum a következő lehet:
{
"values": [
{
"recordId": "1",
"data":
{
"text": "The brown fox jumps over the dog",
"itemsToInsert": ["quick", "lazy"],
"offsets": [3, 28]
}
}
]
}
Példakimenet
Ez a példa az előző bemenet kimenetét mutatja, feltéve, hogy az insertPreTag értéke " "
, és az insertPostTag értéke ""
.
{
"values": [
{
"recordId": "1",
"data":
{
"mergedText": "The quick brown fox jumps over the lazy dog"
}
}
]
}
Kiterjesztett mintakészség-definíció
A Szövegegyesítés használata gyakran előfordul a képek szöveges ábrázolásának (OCR-képességből származó szöveg vagy kép feliratának) a dokumentum tartalommezőbe való egyesítése.
Az alábbi példaismereti csoport az OCR-képesség használatával kinyeri a szöveget a dokumentumba beágyazott képekből. Ezután létrehoz egy merged_text mezőt, amely az egyes képek eredeti és OCRed szövegét is tartalmazza. Az OCR-képességről itt tudhat meg többet.
{
"description": "Extract text from images and merge with content text to produce merged_text",
"skills":
[
{
"description": "Extract text (plain and structured) from image.",
"@odata.type": "#Microsoft.Skills.Vision.OcrSkill",
"context": "/document/normalized_images/*",
"defaultLanguageCode": "en",
"detectOrientation": true,
"inputs": [
{
"name": "image",
"source": "/document/normalized_images/*"
}
],
"outputs": [
{
"name": "text"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.MergeSkill",
"description": "Create merged_text, which includes all the textual representation of each image inserted at the right location in the content field.",
"context": "/document",
"insertPreTag": " ",
"insertPostTag": " ",
"inputs": [
{
"name":"text",
"source": "/document/content"
},
{
"name": "itemsToInsert",
"source": "/document/normalized_images/*/text"
},
{
"name":"offsets",
"source": "/document/normalized_images/*/contentOffset"
}
],
"outputs": [
{
"name": "mergedText",
"targetName" : "merged_text"
}
]
}
]
}
A fenti példa feltételezi, hogy létezik normalizált képmező. Normalized-images mező lekéréséhez állítsa be az indexelő definíciójában lévő imageAction konfigurációt úgy, hogy létrehozza aNormalizedImages értéket az alábbi módon:
{
//...rest of your indexer definition goes here ...
"parameters":{
"configuration":{
"dataToExtract":"contentAndMetadata",
"imageAction":"generateNormalizedImages"
}
}
}