Tartalom elemzése vagy adattömbök elemzése munkafolyamatokhoz az Azure Logic Appsben (előzetes verzió)

Cikk
02/11/2025

A következőkre vonatkozik: Azure Logic Apps (Használat + Standard)

Fontos

Ez a funkció előzetes verzióban érhető el, és a Microsoft Azure előzetes verziójának kiegészítő használati feltételei vonatkoznak.

Előfordulhat, hogy a tartalmat jogkivonatokká kell alakítania, amelyek szavak vagy karaktertömbök, vagy egy nagy dokumentumot kisebb darabokra kell osztania, mielőtt bizonyos műveletekkel használhatja ezt a tartalmat. Az Azure AI Search vagy az Azure OpenAI-műveletek például jogkivonatos bemenetre számítanak, és csak korlátozott számú jogkivonatot képesek kezelni.

Ezekben a forgatókönyvekben használja a dokumentum és az adattömb szövegének elemzése a logikai alkalmazás munkafolyamatában nevű adatműveletiműveleteket. Ezek a műveletek a tartalmat, például PDF-dokumentumot, CSV-fájlt, Excel-fájlt stb. jogkivonatos sztringkimenetté alakítják, majd a jogkivonatok száma alapján darabra osztják a sztringet. Ezután hivatkozhat ezekre a kimenetekre a munkafolyamat későbbi műveleteivel.

Tipp.

További információért tegye fel az Azure Copilotnak az alábbi kérdéseket:

Mi az a jogkivonat az AI-ban?
Mi az a jogkivonatos bemenet?
Mi az a jogkivonatos sztringkimenet?
Mi az elemzés az AI-ben?
Mi az a darabolás az AI-ben?

Az Azure Copilot megkereséséhez az Azure Portal eszköztárán válassza a Copilot lehetőséget.

Ez az útmutató bemutatja, hogyan adhatja hozzá és állíthatja be ezeket a műveleteket a munkafolyamatban.

Ismert problémák és korlátozások

A dokumentum elemzése és a tömbszöveg-műveletek jelenleg nem támogatják a gazdagépfájlokat, például a nagyszámítógépet és a középső bináris fájlokat, például a Virtual Storage Access Method (VSAM) fájlokat. Ha azonban standard munkafolyamatokkal dolgozik, használhatja helyette az IBM Gazdagépfájl beépített műveletét, amelynek neve Elemzés gazdagépfájl tartalma.

Előfeltételek

Azure-fiók és -előfizetés. Ha nem rendelkezik Azure-előfizetéssel, regisztráljon egy ingyenes Azure-fiókra.
Egy használatalapú vagy standard logikai alkalmazás munkafolyamata egy meglévő eseményindítóval, mert a dokumentum elemzése és az Adattömb szövegműveletei csak műveletekként érhetők el. Győződjön meg arról, hogy az elemezni vagy adattömbbe beolvasni kívánt tartalmat lekérő művelet megelőzi ezeket az adatműveleteket.

Dokumentum elemzése

A dokumentum elemzési művelete jogkivonatos sztringgé alakítja a tartalmat, például PDF-dokumentumot, CSV-fájlt, Excel-fájlt stb. Ebben a példában tegyük fel, hogy a munkafolyamat a HTTP-kérés fogadásakor elnevezett Kérelem eseményindítóval kezdődik. Ez az eseményindító megvárja, amíg egy másik összetevőtől, például egy Azure-függvénytől, egy másik logikai alkalmazás munkafolyamatától stb. küldött HTTP-kérést kap. A HTTP-kérés tartalmazza egy új feltöltött dokumentum URL-címét, amely elérhető a munkafolyamat lekéréséhez és elemzéséhez. A HTTP-műveletek azonnal követik az eseményindítót, és HTTP-kérést küldenek a dokumentum URL-címére, és a dokumentum tartalmával együtt visszatérnek a tárhelyéről.

Ha más tartalomforrásokat használ, például az Azure Blob Storage-t, a SharePointot, a OneDrive-ot, a fájlrendszert, az FTP-t stb., ellenőrizheti, hogy elérhetők-e triggerek ezekhez a forrásokhoz. Azt is ellenőrizheti, hogy elérhetők-e műveletek a források tartalmának lekéréséhez. További információ: Beépített műveletek és felügyelt összekötők.

Az Azure Portalon nyissa meg a logikai alkalmazás erőforrását és munkafolyamatát a tervezőben.
A meglévő eseményindító és műveletek alatt kövesse az alábbi általános lépéseket a dokumentum elemzése nevű adatműveleti művelet munkafolyamathoz való hozzáadásához.
A tervezőn válassza a Dokumentum elemzése műveletet.
A műveletinformációs ablaktábla megnyitása után a Paraméterek lap Dokumentumtartalom tulajdonságában adja meg az elemezni kívánt tartalmat az alábbi lépések végrehajtásával:
1. Jelölje be a Dokumentumtartalom mezőben.
  
  Megjelennek a dinamikus tartalomlista (villám ikon) és a kifejezésszerkesztő (függvényikon) beállításai.
  - Az előző művelet kimenetének kiválasztásához válassza ki a dinamikus tartalomlistát.
  - Ha egy előző művelet kimenetét módosító kifejezést szeretne létrehozni, jelölje ki a kifejezésszerkesztőt.
  Ez a példa a dinamikus tartalomlista villámikonjának kiválasztásával folytatódik.
2. A dinamikus tartalomlista megnyitása után válassza ki a kívánt kimenetet egy előző műveletből.
  
  Ebben a példában a dokumentumelemzési művelet a HTTP-művelet Törzs kimenetére hivatkozik.
  
  A Törzskimenet ekkor megjelenik a Dokumentumtartalom mezőben:
A dokumentumelemzési művelet alatt adja hozzá a tokenizált sztringkimenettel használni kívánt műveleteket, például az adattömb szövegét, amelyet az útmutató később ismertet.

Dokumentum elemzése – Hivatkozás

Paraméterek

Név szerint	Érték	Adattípus	Leírás	Korlát
Dokumentum tartalma	< tartalom elemzése>	Bármely	Az elemezni kívánt tartalom.	Egyik sem

Kimenetek

Név	Adattípus	Leírás
A találat szövegének elemzése	Sztringtömb	Sztringek tömbje.
Elemezett eredmény	Objektum	Egy objektum, amely a teljes elemezt szöveget tartalmazza.

Adattömb szövege

Az Adattömb szöveges művelet kisebb részekre osztja a tartalmat, hogy a későbbi műveletek könnyebben használhatók legyenek az aktuális munkafolyamatban. Az alábbi lépések a dokumentumelemzési szakasz példájára épülnek, és felosztják a jogkivonat-sztring kimenetét az Azure AI-műveletekhez, amelyek tokenizált, kis méretű tartalomtömböket várnak.

Feljegyzés

Az adatrészletezést használó előző műveletek nem befolyásolják az Adattömb szöveges műveletét, és az adattömb szövegművelete sem befolyásolja az adattömb-műveletet használó későbbi műveleteket.

Az Azure Portalon nyissa meg a logikai alkalmazás erőforrását és munkafolyamatát a tervezőben.
A dokumentumelemzési művelet alatt kövesse az alábbi általános lépéseket az Adatműveleti művelet adattömb szövegének hozzáadásához.
A tervezőn válassza az Adattömb szövegműveletet .
Miután megnyílik a műveletinformációs ablaktábla, a Paraméterek lapon, az Adattömb-stratégia tulajdonságnál válassza a TokenSize elemet az adattömbelési módszerként, ha még nincs kijelölve.

Stratégia Leírás

TokenSize A megadott tartalom felosztása a jogkivonatok száma alapján.
A stratégia kiválasztása után a Szöveg mezőben adja meg az adattömb tartalmát.

Megjelennek a dinamikus tartalomlista (villám ikon) és a kifejezésszerkesztő (függvényikon) beállításai.
- Az előző művelet kimenetének kiválasztásához válassza ki a dinamikus tartalomlistát.
- Ha egy előző művelet kimenetét módosító kifejezést szeretne létrehozni, jelölje ki a kifejezésszerkesztőt.
Ez a példa a dinamikus tartalomlista villámikonjának kiválasztásával folytatódik.
1. A dinamikus tartalomlista megnyitása után válassza ki a kívánt kimenetet egy előző műveletből.
  
  Ebben a példában az Adattömb szövegművelet a dokumentumelemzési műveletből származó elemzési eredmény szövegkimenetére hivatkozik.
  
  A Szöveg mezőben most az Elemzés eredményművelet kimenete látható:
A kiválasztott stratégia és forgatókönyv alapján végezze el az Adattömb szövegművelet beállítását. További információ: Adattömbszöveg – Hivatkozás.

Stratégia	Leírás
TokenSize	A megadott tartalom felosztása a jogkivonatok száma alapján.

Most, ha más, jogkivonatos bemenetet váró és használó műveleteket ad hozzá, például az Azure AI-műveleteket, a bemeneti tartalom a könnyebb használat érdekében lesz formázva.

Adattömb szövege – Hivatkozás

Paraméterek

Név szerint	Érték	Adattípus	Leírás	Korlátok
Adattömb-stratégia	TokenSize	Sztring enumerálás	Ossza fel a tartalmat a jogkivonatok száma alapján. Alapértelmezett: TokenSize	Nem alkalmazható
Szöveg	< content-to-chunk>	Bármely	Az adattömbbe beszedendő tartalom.	Lásd: Korlátok és konfigurációs referencia-útmutató
EncodingModel	< kódolási módszer>	Sztring enumerálás	A használni kívánt kódolási modell: - Alapértelmezett: cl100k_base (gpt4, gpt-3.5-turbo, gpt-35-turbo) - r50k_base (gpt-3) - p50k_base (gpt-3) - p50k_edit (gpt-3) - cl200k_base (gpt-4o) További információ: OpenAI – Modellek áttekintése.	Nem alkalmazható
TokenSize	< max-tokens-per-chunk>	Egész	A tartalomtömbönkénti jogkivonatok maximális száma. Alapértelmezett: Nincs	Minimum: 1 Maximum: 8000
PageOverlapLength	< egymást átfedő karakterek száma>	Egész	Az előző adattömb végéből a következő adattömbbe belefoglalandó karakterek száma. Ezzel a beállítással elkerülheti a fontos információk elvesztését, ha a tartalmat adattömbökre osztja, és megőrzi a folytonosságot és a kontextust az adattömbök között. Alapértelmezett: 0 – Nincsenek átfedésben lévő karakterek.	Minimum: 0

Tipp.

További információért tegye fel az Azure Copilotnak az alábbi kérdéseket:

Mi a PageOverlapLength az adattömbben?
Mi az Azure AI kódolása?

Az Azure Copilot megkereséséhez az Azure Portal eszköztárán válassza a Copilot lehetőséget.

Kimenetek

Név	Adattípus	Leírás
Darabolt eredmény szöveges elemei	Sztringtömb	Sztringek tömbje.
Darabolt eredmény szövegeleme	Sztring	Egyetlen sztring a tömbben.
Darabolt eredmény	Objektum	Egy objektum, amely a teljes darabolt szöveget tartalmazza.

Példa munkafolyamat

Az alábbi példa más műveleteket is tartalmaz, amelyek teljes munkafolyamat-mintát hoznak létre az adatok bármely forrásból való betöltéséhez:

Képernyőkép a teljes minta-munkafolyamatról.

Lépés	Task	Mögöttes művelet	Leírás
0	Várjon vagy keressen új tartalmat.	HTTP-kérés fogadása	Egy eseményindító, amely vagy lekérdezi vagy megvárja az új adatok érkezését, akár ütemezett ismétlődés alapján, akár adott eseményekre reagálva. Ilyen esemény lehet egy új fájl, amely egy adott tárolórendszerbe van feltöltve, például az Azure Blob Storage-ba, a SharePointba, a OneDrive-ba, a fájlrendszerbe, az FTP-be stb. Ebben a példában a Kérelem eseményindító művelet egy másik végpontról küldött HTTP- vagy HTTPS-kérésre vár. A kérelem tartalmazza egy új feltöltött dokumentum URL-címét.
2	A tartalom lekérése.	HTTP	EGY HTTP-művelet , amely lekéri a feltöltött dokumentumot a fájl URL-címével az eseményindító kimenetéből.
3	Dokumentumadatok írása.	Összeállítás	Adatműveleti művelet, amely összefűzi a különböző elemeket. Ez a példa összefűzi a dokumentum kulcs-érték adatait.
4	Jogkivonat-sztring létrehozása.	Dokumentum elemzése	Adatműveleti művelet, amely jogkivonatos sztringet hoz létre a Compose művelet kimenetével.
5	Tartalomtömbök létrehozása.	Adattömb szövege	Adatműveleti művelet, amely a jogkivonat-sztringet darabokra osztja a tartalomtömbönkénti jogkivonatok száma alapján.
6	Konvertálja a jogkivonatos és az adattömbbe írt szöveget JSON-ra.	JSON elemzése	Adatműveleti művelet, amely az adattömb kimenetét JSON-tömbté alakítja.
7	Válassza ki a JSON-tömbelemeket.	Kiválasztás	Adatműveleti művelet, amely több elemet választ ki a JSON-tömbből.
8	Hozza létre a beágyazásokat.	Több beágyazás lekérése	Egy Azure OpenAI-művelet , amely beágyazásokat hoz létre az egyes JSON-tömbelemekhez.
9	Válassza ki a beágyazásokat és egyéb információkat.	Kiválasztás	Adatműveleti művelet, amely a beágyazásokat és más dokumentumadatokat választja ki.
10	Indexelje az adatokat.	Dokumentumok indexelése	Egy Azure AI Search-művelet , amely az egyes kijelölt beágyazások alapján indexeli az adatokat.

Megosztás a következőn keresztül:

Tartalom elemzése vagy adattömbök elemzése munkafolyamatokhoz az Azure Logic Appsben (előzetes verzió)

Ismert problémák és korlátozások

Előfeltételek

Dokumentum elemzése

Dokumentum elemzése – Hivatkozás

Paraméterek

Kimenetek

Adattömb szövege

Adattömb szövege – Hivatkozás

Paraméterek

Kimenetek

Példa munkafolyamat

Visszajelzés

További források

Megosztás a következőn keresztül:

Tartalom elemzése vagy adattömbök elemzése munkafolyamatokhoz az Azure Logic Appsben (előzetes verzió)

Ismert problémák és korlátozások

Előfeltételek

Dokumentum elemzése

Dokumentum elemzése – Hivatkozás

Paraméterek

Kimenetek

Adattömb szövege

Adattömb szövege – Hivatkozás

Paraméterek

Kimenetek

Példa munkafolyamat

Kapcsolódó tartalom

Visszajelzés

További források