Megosztás a következőn keresztül:


Tartalom elemzése vagy adattömbök elemzése munkafolyamatokhoz az Azure Logic Appsben (előzetes verzió)

A következőkre vonatkozik: Azure Logic Apps (Használat + Standard)

Fontos

Ez a funkció előzetes verzióban érhető el, és a Microsoft Azure előzetes verziójának kiegészítő használati feltételei vonatkoznak.

Előfordulhat, hogy a tartalmat jogkivonatokká kell alakítania, amelyek szavak vagy karaktertömbök, vagy egy nagy dokumentumot kisebb darabokra kell osztania, mielőtt bizonyos műveletekkel használhatja ezt a tartalmat. Az Azure AI Search vagy az Azure OpenAI-műveletek például jogkivonatos bemenetre számítanak, és csak korlátozott számú jogkivonatot képesek kezelni.

Ezekben a forgatókönyvekben használja a dokumentum és az adattömb szövegének elemzése a logikai alkalmazás munkafolyamatában nevű adatműveletiműveleteket. Ezek a műveletek a tartalmat, például PDF-dokumentumot, CSV-fájlt, Excel-fájlt stb. jogkivonatos sztringkimenetté alakítják, majd a jogkivonatok száma alapján darabra osztják a sztringet. Ezután hivatkozhat ezekre a kimenetekre a munkafolyamat későbbi műveleteivel.

Tipp.

További információért tegye fel az Azure Copilotnak az alábbi kérdéseket:

  • Mi az a jogkivonat az AI-ban?
  • Mi az a jogkivonatos bemenet?
  • Mi az a jogkivonatos sztringkimenet?
  • Mi az elemzés az AI-ben?
  • Mi az a darabolás az AI-ben?

Az Azure Copilot megkereséséhez az Azure Portal eszköztárán válassza a Copilot lehetőséget.

Ez az útmutató bemutatja, hogyan adhatja hozzá és állíthatja be ezeket a műveleteket a munkafolyamatban.

Ismert problémák és korlátozások

A dokumentum elemzése és a tömbszöveg-műveletek jelenleg nem támogatják a gazdagépfájlokat, például a nagyszámítógépet és a középső bináris fájlokat, például a Virtual Storage Access Method (VSAM) fájlokat. Ha azonban standard munkafolyamatokkal dolgozik, használhatja helyette az IBM Gazdagépfájl beépített műveletét, amelynek neve Elemzés gazdagépfájl tartalma.

Előfeltételek

  • Azure-fiók és -előfizetés. Ha nem rendelkezik Azure-előfizetéssel, regisztráljon egy ingyenes Azure-fiókra.

  • Egy használatalapú vagy standard logikai alkalmazás munkafolyamata egy meglévő eseményindítóval, mert a dokumentum elemzése és az Adattömb szövegműveletei csak műveletekként érhetők el. Győződjön meg arról, hogy az elemezni vagy adattömbbe beolvasni kívánt tartalmat lekérő művelet megelőzi ezeket az adatműveleteket.

Dokumentum elemzése

A dokumentum elemzési művelete jogkivonatos sztringgé alakítja a tartalmat, például PDF-dokumentumot, CSV-fájlt, Excel-fájlt stb. Ebben a példában tegyük fel, hogy a munkafolyamat a HTTP-kérés fogadásakor elnevezett Kérelem eseményindítóval kezdődik. Ez az eseményindító megvárja, amíg egy másik összetevőtől, például egy Azure-függvénytől, egy másik logikai alkalmazás munkafolyamatától stb. küldött HTTP-kérést kap. A HTTP-kérés tartalmazza egy új feltöltött dokumentum URL-címét, amely elérhető a munkafolyamat lekéréséhez és elemzéséhez. A HTTP-műveletek azonnal követik az eseményindítót, és HTTP-kérést küldenek a dokumentum URL-címére, és a dokumentum tartalmával együtt visszatérnek a tárhelyéről.

Ha más tartalomforrásokat használ, például az Azure Blob Storage-t, a SharePointot, a OneDrive-ot, a fájlrendszert, az FTP-t stb., ellenőrizheti, hogy elérhetők-e triggerek ezekhez a forrásokhoz. Azt is ellenőrizheti, hogy elérhetők-e műveletek a források tartalmának lekéréséhez. További információ: Beépített műveletek és felügyelt összekötők.

  1. Az Azure Portalon nyissa meg a logikai alkalmazás erőforrását és munkafolyamatát a tervezőben.

  2. A meglévő eseményindító és műveletek alatt kövesse az alábbi általános lépéseket a dokumentum elemzése nevű adatműveleti művelet munkafolyamathoz való hozzáadásához.

  3. A tervezőn válassza a Dokumentum elemzése műveletet.

  4. A műveletinformációs ablaktábla megnyitása után a Paraméterek lap Dokumentumtartalom tulajdonságában adja meg az elemezni kívánt tartalmat az alábbi lépések végrehajtásával:

    1. Jelölje be a Dokumentumtartalom mezőben.

      Megjelennek a dinamikus tartalomlista (villám ikon) és a kifejezésszerkesztő (függvényikon) beállításai.

      • Az előző művelet kimenetének kiválasztásához válassza ki a dinamikus tartalomlistát.

      • Ha egy előző művelet kimenetét módosító kifejezést szeretne létrehozni, jelölje ki a kifejezésszerkesztőt.

      Ez a példa a dinamikus tartalomlista villámikonjának kiválasztásával folytatódik.

    2. A dinamikus tartalomlista megnyitása után válassza ki a kívánt kimenetet egy előző műveletből.

      Ebben a példában a dokumentumelemzési művelet a HTTP-művelet Törzs kimenetére hivatkozik.

      Képernyőkép a munkafolyamat-tervezőről, amely egy megnyitott dinamikus tartalomlistával és a HTTP-műveletből kiválasztott Törzskimenettel rendelkező dokumentum elemzése nevű művelettel rendelkezik.

      A Törzskimenet ekkor megjelenik a Dokumentumtartalom mezőben:

      Képernyőkép a dokumentum elemzése nevű művelet törzskimenetével rendelkező minta-munkafolyamatról.

  5. A dokumentumelemzési művelet alatt adja hozzá a tokenizált sztringkimenettel használni kívánt műveleteket, például az adattömb szövegét, amelyet az útmutató később ismertet.

Dokumentum elemzése – Hivatkozás

Paraméterek

Név szerint Érték Adattípus Leírás Korlát
Dokumentum tartalma < tartalom elemzése> Bármely Az elemezni kívánt tartalom. Egyik sem

Kimenetek

Név Adattípus Leírás
A találat szövegének elemzése Sztringtömb Sztringek tömbje.
Elemezett eredmény Objektum Egy objektum, amely a teljes elemezt szöveget tartalmazza.

Adattömb szövege

Az Adattömb szöveges művelet kisebb részekre osztja a tartalmat, hogy a későbbi műveletek könnyebben használhatók legyenek az aktuális munkafolyamatban. Az alábbi lépések a dokumentumelemzési szakasz példájára épülnek, és felosztják a jogkivonat-sztring kimenetét az Azure AI-műveletekhez, amelyek tokenizált, kis méretű tartalomtömböket várnak.

Feljegyzés

Az adatrészletezést használó előző műveletek nem befolyásolják az Adattömb szöveges műveletét, és az adattömb szövegművelete sem befolyásolja az adattömb-műveletet használó későbbi műveleteket.

  1. Az Azure Portalon nyissa meg a logikai alkalmazás erőforrását és munkafolyamatát a tervezőben.

  2. A dokumentumelemzési művelet alatt kövesse az alábbi általános lépéseket az Adatműveleti művelet adattömb szövegének hozzáadásához.

  3. A tervezőn válassza az Adattömb szövegműveletet .

  4. Miután megnyílik a műveletinformációs ablaktábla, a Paraméterek lapon, az Adattömb-stratégia tulajdonságnál válassza a TokenSize elemet az adattömbelési módszerként, ha még nincs kijelölve.

    Stratégia Leírás
    TokenSize A megadott tartalom felosztása a jogkivonatok száma alapján.
  5. A stratégia kiválasztása után a Szöveg mezőben adja meg az adattömb tartalmát.

    Megjelennek a dinamikus tartalomlista (villám ikon) és a kifejezésszerkesztő (függvényikon) beállításai.

    • Az előző művelet kimenetének kiválasztásához válassza ki a dinamikus tartalomlistát.

    • Ha egy előző művelet kimenetét módosító kifejezést szeretne létrehozni, jelölje ki a kifejezésszerkesztőt.

    Ez a példa a dinamikus tartalomlista villámikonjának kiválasztásával folytatódik.

    1. A dinamikus tartalomlista megnyitása után válassza ki a kívánt kimenetet egy előző műveletből.

      Ebben a példában az Adattömb szövegművelet a dokumentumelemzési műveletből származó elemzési eredmény szövegkimenetére hivatkozik.

      Képernyőkép a munkafolyamat-tervezőről, az Adattömb szöveg nevű műveletről a megnyitott dinamikus tartalomlistával, valamint a dokumentumművelet elemzéséből kiválasztott kimenetről.

      A Szöveg mezőben most az Elemzés eredményművelet kimenete látható:

      Képernyőkép a minta-munkafolyamatról, amelyen kijelölt elemzési eredmény szövegkimenete látható az Adattömb szöveg nevű műveletben.

  6. A kiválasztott stratégia és forgatókönyv alapján végezze el az Adattömb szövegművelet beállítását. További információ: Adattömbszöveg – Hivatkozás.

Most, ha más, jogkivonatos bemenetet váró és használó műveleteket ad hozzá, például az Azure AI-műveleteket, a bemeneti tartalom a könnyebb használat érdekében lesz formázva.

Adattömb szövege – Hivatkozás

Paraméterek

Név szerint Érték Adattípus Leírás Korlátok
Adattömb-stratégia TokenSize Sztring enumerálás Ossza fel a tartalmat a jogkivonatok száma alapján.

Alapértelmezett: TokenSize
Nem alkalmazható
Szöveg < content-to-chunk> Bármely Az adattömbbe beszedendő tartalom. Lásd: Korlátok és konfigurációs referencia-útmutató
EncodingModel < kódolási módszer> Sztring enumerálás A használni kívánt kódolási modell:

- Alapértelmezett: cl100k_base (gpt4, gpt-3.5-turbo, gpt-35-turbo)

- r50k_base (gpt-3)

- p50k_base (gpt-3)

- p50k_edit (gpt-3)

- cl200k_base (gpt-4o)

További információ: OpenAI – Modellek áttekintése.
Nem alkalmazható
TokenSize < max-tokens-per-chunk> Egész A tartalomtömbönkénti jogkivonatok maximális száma.

Alapértelmezett: Nincs
Minimum: 1
Maximum: 8000
PageOverlapLength < egymást átfedő karakterek száma> Egész Az előző adattömb végéből a következő adattömbbe belefoglalandó karakterek száma. Ezzel a beállítással elkerülheti a fontos információk elvesztését, ha a tartalmat adattömbökre osztja, és megőrzi a folytonosságot és a kontextust az adattömbök között.

Alapértelmezett: 0 – Nincsenek átfedésben lévő karakterek.
Minimum: 0

Tipp.

További információért tegye fel az Azure Copilotnak az alábbi kérdéseket:

  • Mi a PageOverlapLength az adattömbben?
  • Mi az Azure AI kódolása?

Az Azure Copilot megkereséséhez az Azure Portal eszköztárán válassza a Copilot lehetőséget.

Kimenetek

Név Adattípus Leírás
Darabolt eredmény szöveges elemei Sztringtömb Sztringek tömbje.
Darabolt eredmény szövegeleme Sztring Egyetlen sztring a tömbben.
Darabolt eredmény Objektum Egy objektum, amely a teljes darabolt szöveget tartalmazza.

Példa munkafolyamat

Az alábbi példa más műveleteket is tartalmaz, amelyek teljes munkafolyamat-mintát hoznak létre az adatok bármely forrásból való betöltéséhez:

Képernyőkép a teljes minta-munkafolyamatról.

Lépés Task Mögöttes művelet Leírás
0 Várjon vagy keressen új tartalmat. HTTP-kérés fogadása Egy eseményindító, amely vagy lekérdezi vagy megvárja az új adatok érkezését, akár ütemezett ismétlődés alapján, akár adott eseményekre reagálva. Ilyen esemény lehet egy új fájl, amely egy adott tárolórendszerbe van feltöltve, például az Azure Blob Storage-ba, a SharePointba, a OneDrive-ba, a fájlrendszerbe, az FTP-be stb.

Ebben a példában a Kérelem eseményindító művelet egy másik végpontról küldött HTTP- vagy HTTPS-kérésre vár. A kérelem tartalmazza egy új feltöltött dokumentum URL-címét.
2 A tartalom lekérése. HTTP EGY HTTP-művelet , amely lekéri a feltöltött dokumentumot a fájl URL-címével az eseményindító kimenetéből.
3 Dokumentumadatok írása. Összeállítás Adatműveleti művelet, amely összefűzi a különböző elemeket.

Ez a példa összefűzi a dokumentum kulcs-érték adatait.
4 Jogkivonat-sztring létrehozása. Dokumentum elemzése Adatműveleti művelet, amely jogkivonatos sztringet hoz létre a Compose művelet kimenetével.
5 Tartalomtömbök létrehozása. Adattömb szövege Adatműveleti művelet, amely a jogkivonat-sztringet darabokra osztja a tartalomtömbönkénti jogkivonatok száma alapján.
6 Konvertálja a jogkivonatos és az adattömbbe írt szöveget JSON-ra. JSON elemzése Adatműveleti művelet, amely az adattömb kimenetét JSON-tömbté alakítja.
7 Válassza ki a JSON-tömbelemeket. Kiválasztás Adatműveleti művelet, amely több elemet választ ki a JSON-tömbből.
8 Hozza létre a beágyazásokat. Több beágyazás lekérése Egy Azure OpenAI-művelet , amely beágyazásokat hoz létre az egyes JSON-tömbelemekhez.
9 Válassza ki a beágyazásokat és egyéb információkat. Kiválasztás Adatműveleti művelet, amely a beágyazásokat és más dokumentumadatokat választja ki.
10 Indexelje az adatokat. Dokumentumok indexelése Egy Azure AI Search-művelet , amely az egyes kijelölt beágyazások alapján indexeli az adatokat.