Szövegegyesítési kognitív képesség

Cikk
09/01/2024

A Szövegegyesítés képesség sztringtömbből egyetlen mezőbe összesíti a szöveget.

Feljegyzés

Ez a képesség nem kötődik az Azure AI-szolgáltatásokhoz. Nem számlázható, és nincs Azure AI-szolgáltatások kulcskövetelménye.

@odata.type

Microsoft.Skills.Text.MergeSkill

Képességparaméterek

A paraméterek megkülönböztetik a kis- és nagybetűket.

Paraméter neve	Leírás
`insertPreTag`	Minden beszúrás előtt belefoglalandó sztring. Az alapértelmezett érték `" "`. A szóköz kihagyásához állítsa az értéket a következőre `""`: .
`insertPostTag`	Minden beszúrás után belefoglalandó sztring. Az alapértelmezett érték `" "`. A szóköz kihagyásához állítsa az értéket a következőre `""`: .

Készségbemenetek

Bemeneti név	Leírás
`itemsToInsert`	Egyesítendő sztringek tömbje.
`text`	(nem kötelező) A beszúrandó fő szövegtörzs. Ha `text` nincs megadva, a `itemsToInsert` rendszer összefűzi az elemeket.
`offsets`	(nem kötelező) A beszúrandó pozíciók `text` `itemsToInsert` tömbje. Ha meg van adva, az elemek számának `text` meg kell egyenlnie az elemek számával `textToInsert`. Ellenkező esetben az összes elem hozzá lesz fűzve a sor végén `text`.

Képességkimenetek

Kimeneti név	Leírás
`mergedText`	Az eredményül kapott egyesített szöveg.
`mergedOffsets`	Olyan pozíciók `mergedText` tömbje, amelyek elemeit `itemsToInsert` beszúrták.

Példabemenet

Ehhez a képességhez használható bemenetet biztosító JSON-dokumentum a következő lehet:

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "text": "The brown fox jumps over the dog",
        "itemsToInsert": ["quick", "lazy"],
        "offsets": [3, 28]
      }
    }
  ]
}

Példakimenet

Ez a példa az előző bemenet kimenetét mutatja, feltéve, hogy az insertPreTag értéke " ", és az insertPostTag értéke "".

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "mergedText": "The quick brown fox jumps over the lazy dog"
      }
    }
  ]
}

Kiterjesztett mintakészség-definíció

A Szövegegyesítés használata gyakran előfordul a képek szöveges ábrázolásának (OCR-képességből származó szöveg vagy kép feliratának) a dokumentum tartalommezőbe való egyesítése.

Az alábbi példaismereti csoport az OCR-képesség használatával kinyeri a szöveget a dokumentumba beágyazott képekből. Ezután létrehoz egy merged_text mezőt, amely az egyes képek eredeti és OCRed szövegét is tartalmazza. Az OCR-képességről itt tudhat meg többet.

{
  "description": "Extract text from images and merge with content text to produce merged_text",
  "skills":
  [
    {
      "description": "Extract text (plain and structured) from image.",
      "@odata.type": "#Microsoft.Skills.Vision.OcrSkill",
      "context": "/document/normalized_images/*",
      "defaultLanguageCode": "en",
      "detectOrientation": true,
      "inputs": [
        {
          "name": "image",
          "source": "/document/normalized_images/*"
        }
      ],
      "outputs": [
        {
          "name": "text"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.MergeSkill",
      "description": "Create merged_text, which includes all the textual representation of each image inserted at the right location in the content field.",
      "context": "/document",
      "insertPreTag": " ",
      "insertPostTag": " ",
      "inputs": [
        {
          "name":"text", 
          "source": "/document/content"
        },
        {
          "name": "itemsToInsert", 
          "source": "/document/normalized_images/*/text"
        },
        {
          "name":"offsets", 
          "source": "/document/normalized_images/*/contentOffset" 
        }
      ],
      "outputs": [
        {
          "name": "mergedText", 
          "targetName" : "merged_text"
        }
      ]
    }
  ]
}

A fenti példa feltételezi, hogy létezik normalizált képmező. Normalized-images mező lekéréséhez állítsa be az indexelő definíciójában lévő imageAction konfigurációt úgy, hogy létrehozza aNormalizedImages értéket az alábbi módon:

{
  //...rest of your indexer definition goes here ...
  "parameters":{
    "configuration":{
        "dataToExtract":"contentAndMetadata",
        "imageAction":"generateNormalizedImages"
    }
  }
}

Megosztás a következőn keresztül: