Tartalom elemzése vagy adattömbök elemzése munkafolyamatokhoz az Azure Logic Appsben (előzetes verzió)
A következőkre vonatkozik: Azure Logic Apps (Használat + Standard)
Fontos
Ez a funkció előzetes verzióban érhető el, és a Microsoft Azure előzetes verziójának kiegészítő használati feltételei vonatkoznak.
Előfordulhat, hogy a tartalmat jogkivonatokká kell alakítania, amelyek szavak vagy karaktertömbök, vagy egy nagy dokumentumot kisebb darabokra kell osztania, mielőtt bizonyos műveletekkel használhatja ezt a tartalmat. Az Azure AI Search vagy az Azure OpenAI-műveletek például jogkivonatos bemenetre számítanak, és csak korlátozott számú jogkivonatot képesek kezelni.
Ezekben a forgatókönyvekben használja a dokumentum és az adattömb szövegének elemzése a logikai alkalmazás munkafolyamatában nevű adatműveletiműveleteket. Ezek a műveletek a tartalmat, például PDF-dokumentumot, CSV-fájlt, Excel-fájlt stb. jogkivonatos sztringkimenetté alakítják, majd a jogkivonatok száma alapján darabra osztják a sztringet. Ezután hivatkozhat ezekre a kimenetekre a munkafolyamat későbbi műveleteivel.
Tipp.
További információért tegye fel az Azure Copilotnak az alábbi kérdéseket:
- Mi az a jogkivonat az AI-ban?
- Mi az a jogkivonatos bemenet?
- Mi az a jogkivonatos sztringkimenet?
- Mi az elemzés az AI-ben?
- Mi az a darabolás az AI-ben?
Az Azure Copilot megkereséséhez az Azure Portal eszköztárán válassza a Copilot lehetőséget.
Ez az útmutató bemutatja, hogyan adhatja hozzá és állíthatja be ezeket a műveleteket a munkafolyamatban.
Ismert problémák és korlátozások
A dokumentum elemzése és a tömbszöveg-műveletek jelenleg nem támogatják a gazdagépfájlokat, például a nagyszámítógépet és a középső bináris fájlokat, például a Virtual Storage Access Method (VSAM) fájlokat. Ha azonban standard munkafolyamatokkal dolgozik, használhatja helyette az IBM Gazdagépfájl beépített műveletét, amelynek neve Elemzés gazdagépfájl tartalma.
Előfeltételek
Azure-fiók és -előfizetés. Ha nem rendelkezik Azure-előfizetéssel, regisztráljon egy ingyenes Azure-fiókra.
Egy használatalapú vagy standard logikai alkalmazás munkafolyamata egy meglévő eseményindítóval, mert a dokumentum elemzése és az Adattömb szövegműveletei csak műveletekként érhetők el. Győződjön meg arról, hogy az elemezni vagy adattömbbe beolvasni kívánt tartalmat lekérő művelet megelőzi ezeket az adatműveleteket.
Dokumentum elemzése
A dokumentum elemzési művelete jogkivonatos sztringgé alakítja a tartalmat, például PDF-dokumentumot, CSV-fájlt, Excel-fájlt stb. Ebben a példában tegyük fel, hogy a munkafolyamat a HTTP-kérés fogadásakor elnevezett Kérelem eseményindítóval kezdődik. Ez az eseményindító megvárja, amíg egy másik összetevőtől, például egy Azure-függvénytől, egy másik logikai alkalmazás munkafolyamatától stb. küldött HTTP-kérést kap. A HTTP-kérés tartalmazza egy új feltöltött dokumentum URL-címét, amely elérhető a munkafolyamat lekéréséhez és elemzéséhez. A HTTP-műveletek azonnal követik az eseményindítót, és HTTP-kérést küldenek a dokumentum URL-címére, és a dokumentum tartalmával együtt visszatérnek a tárhelyéről.
Ha más tartalomforrásokat használ, például az Azure Blob Storage-t, a SharePointot, a OneDrive-ot, a fájlrendszert, az FTP-t stb., ellenőrizheti, hogy elérhetők-e triggerek ezekhez a forrásokhoz. Azt is ellenőrizheti, hogy elérhetők-e műveletek a források tartalmának lekéréséhez. További információ: Beépített műveletek és felügyelt összekötők.
Az Azure Portalon nyissa meg a logikai alkalmazás erőforrását és munkafolyamatát a tervezőben.
A meglévő eseményindító és műveletek alatt kövesse az alábbi általános lépéseket a dokumentum elemzése nevű adatműveleti művelet munkafolyamathoz való hozzáadásához.
A tervezőn válassza a Dokumentum elemzése műveletet.
A műveletinformációs ablaktábla megnyitása után a Paraméterek lap Dokumentumtartalom tulajdonságában adja meg az elemezni kívánt tartalmat az alábbi lépések végrehajtásával:
Jelölje be a Dokumentumtartalom mezőben.
Megjelennek a dinamikus tartalomlista (villám ikon) és a kifejezésszerkesztő (függvényikon) beállításai.
Az előző művelet kimenetének kiválasztásához válassza ki a dinamikus tartalomlistát.
Ha egy előző művelet kimenetét módosító kifejezést szeretne létrehozni, jelölje ki a kifejezésszerkesztőt.
Ez a példa a dinamikus tartalomlista villámikonjának kiválasztásával folytatódik.
A dinamikus tartalomlista megnyitása után válassza ki a kívánt kimenetet egy előző műveletből.
Ebben a példában a dokumentumelemzési művelet a HTTP-művelet Törzs kimenetére hivatkozik.
A Törzskimenet ekkor megjelenik a Dokumentumtartalom mezőben:
A dokumentumelemzési művelet alatt adja hozzá a tokenizált sztringkimenettel használni kívánt műveleteket, például az adattömb szövegét, amelyet az útmutató később ismertet.
Dokumentum elemzése – Hivatkozás
Paraméterek
Név szerint | Érték | Adattípus | Leírás | Korlát |
---|---|---|---|---|
Dokumentum tartalma | < tartalom elemzése> | Bármely | Az elemezni kívánt tartalom. | Egyik sem |
Kimenetek
Név | Adattípus | Leírás |
---|---|---|
A találat szövegének elemzése | Sztringtömb | Sztringek tömbje. |
Elemezett eredmény | Objektum | Egy objektum, amely a teljes elemezt szöveget tartalmazza. |
Adattömb szövege
Az Adattömb szöveges művelet kisebb részekre osztja a tartalmat, hogy a későbbi műveletek könnyebben használhatók legyenek az aktuális munkafolyamatban. Az alábbi lépések a dokumentumelemzési szakasz példájára épülnek, és felosztják a jogkivonat-sztring kimenetét az Azure AI-műveletekhez, amelyek tokenizált, kis méretű tartalomtömböket várnak.
Feljegyzés
Az adatrészletezést használó előző műveletek nem befolyásolják az Adattömb szöveges műveletét, és az adattömb szövegművelete sem befolyásolja az adattömb-műveletet használó későbbi műveleteket.
Az Azure Portalon nyissa meg a logikai alkalmazás erőforrását és munkafolyamatát a tervezőben.
A dokumentumelemzési művelet alatt kövesse az alábbi általános lépéseket az Adatműveleti művelet adattömb szövegének hozzáadásához.
A tervezőn válassza az Adattömb szövegműveletet .
Miután megnyílik a műveletinformációs ablaktábla, a Paraméterek lapon, az Adattömb-stratégia tulajdonságnál válassza a TokenSize elemet az adattömbelési módszerként, ha még nincs kijelölve.
Stratégia Leírás TokenSize A megadott tartalom felosztása a jogkivonatok száma alapján. A stratégia kiválasztása után a Szöveg mezőben adja meg az adattömb tartalmát.
Megjelennek a dinamikus tartalomlista (villám ikon) és a kifejezésszerkesztő (függvényikon) beállításai.
Az előző művelet kimenetének kiválasztásához válassza ki a dinamikus tartalomlistát.
Ha egy előző művelet kimenetét módosító kifejezést szeretne létrehozni, jelölje ki a kifejezésszerkesztőt.
Ez a példa a dinamikus tartalomlista villámikonjának kiválasztásával folytatódik.
A dinamikus tartalomlista megnyitása után válassza ki a kívánt kimenetet egy előző műveletből.
Ebben a példában az Adattömb szövegművelet a dokumentumelemzési műveletből származó elemzési eredmény szövegkimenetére hivatkozik.
A Szöveg mezőben most az Elemzés eredményművelet kimenete látható:
A kiválasztott stratégia és forgatókönyv alapján végezze el az Adattömb szövegművelet beállítását. További információ: Adattömbszöveg – Hivatkozás.
Most, ha más, jogkivonatos bemenetet váró és használó műveleteket ad hozzá, például az Azure AI-műveleteket, a bemeneti tartalom a könnyebb használat érdekében lesz formázva.
Adattömb szövege – Hivatkozás
Paraméterek
Név szerint | Érték | Adattípus | Leírás | Korlátok |
---|---|---|---|---|
Adattömb-stratégia | TokenSize | Sztring enumerálás | Ossza fel a tartalmat a jogkivonatok száma alapján. Alapértelmezett: TokenSize |
Nem alkalmazható |
Szöveg | < content-to-chunk> | Bármely | Az adattömbbe beszedendő tartalom. | Lásd: Korlátok és konfigurációs referencia-útmutató |
EncodingModel | < kódolási módszer> | Sztring enumerálás | A használni kívánt kódolási modell: - Alapértelmezett: cl100k_base (gpt4, gpt-3.5-turbo, gpt-35-turbo) - r50k_base (gpt-3) - p50k_base (gpt-3) - p50k_edit (gpt-3) - cl200k_base (gpt-4o) További információ: OpenAI – Modellek áttekintése. |
Nem alkalmazható |
TokenSize | < max-tokens-per-chunk> | Egész | A tartalomtömbönkénti jogkivonatok maximális száma. Alapértelmezett: Nincs |
Minimum: 1 Maximum: 8000 |
PageOverlapLength | < egymást átfedő karakterek száma> | Egész | Az előző adattömb végéből a következő adattömbbe belefoglalandó karakterek száma. Ezzel a beállítással elkerülheti a fontos információk elvesztését, ha a tartalmat adattömbökre osztja, és megőrzi a folytonosságot és a kontextust az adattömbök között. Alapértelmezett: 0 – Nincsenek átfedésben lévő karakterek. |
Minimum: 0 |
Tipp.
További információért tegye fel az Azure Copilotnak az alábbi kérdéseket:
- Mi a PageOverlapLength az adattömbben?
- Mi az Azure AI kódolása?
Az Azure Copilot megkereséséhez az Azure Portal eszköztárán válassza a Copilot lehetőséget.
Kimenetek
Név | Adattípus | Leírás |
---|---|---|
Darabolt eredmény szöveges elemei | Sztringtömb | Sztringek tömbje. |
Darabolt eredmény szövegeleme | Sztring | Egyetlen sztring a tömbben. |
Darabolt eredmény | Objektum | Egy objektum, amely a teljes darabolt szöveget tartalmazza. |
Példa munkafolyamat
Az alábbi példa más műveleteket is tartalmaz, amelyek teljes munkafolyamat-mintát hoznak létre az adatok bármely forrásból való betöltéséhez:
Lépés | Task | Mögöttes művelet | Leírás |
---|---|---|---|
0 | Várjon vagy keressen új tartalmat. | HTTP-kérés fogadása | Egy eseményindító, amely vagy lekérdezi vagy megvárja az új adatok érkezését, akár ütemezett ismétlődés alapján, akár adott eseményekre reagálva. Ilyen esemény lehet egy új fájl, amely egy adott tárolórendszerbe van feltöltve, például az Azure Blob Storage-ba, a SharePointba, a OneDrive-ba, a fájlrendszerbe, az FTP-be stb. Ebben a példában a Kérelem eseményindító művelet egy másik végpontról küldött HTTP- vagy HTTPS-kérésre vár. A kérelem tartalmazza egy új feltöltött dokumentum URL-címét. |
2 | A tartalom lekérése. | HTTP | EGY HTTP-művelet , amely lekéri a feltöltött dokumentumot a fájl URL-címével az eseményindító kimenetéből. |
3 | Dokumentumadatok írása. | Összeállítás | Adatműveleti művelet, amely összefűzi a különböző elemeket. Ez a példa összefűzi a dokumentum kulcs-érték adatait. |
4 | Jogkivonat-sztring létrehozása. | Dokumentum elemzése | Adatműveleti művelet, amely jogkivonatos sztringet hoz létre a Compose művelet kimenetével. |
5 | Tartalomtömbök létrehozása. | Adattömb szövege | Adatműveleti művelet, amely a jogkivonat-sztringet darabokra osztja a tartalomtömbönkénti jogkivonatok száma alapján. |
6 | Konvertálja a jogkivonatos és az adattömbbe írt szöveget JSON-ra. | JSON elemzése | Adatműveleti művelet, amely az adattömb kimenetét JSON-tömbté alakítja. |
7 | Válassza ki a JSON-tömbelemeket. | Kiválasztás | Adatműveleti művelet, amely több elemet választ ki a JSON-tömbből. |
8 | Hozza létre a beágyazásokat. | Több beágyazás lekérése | Egy Azure OpenAI-művelet , amely beágyazásokat hoz létre az egyes JSON-tömbelemekhez. |
9 | Válassza ki a beágyazásokat és egyéb információkat. | Kiválasztás | Adatműveleti művelet, amely a beágyazásokat és más dokumentumadatokat választja ki. |
10 | Indexelje az adatokat. | Dokumentumok indexelése | Egy Azure AI Search-művelet , amely az egyes kijelölt beágyazások alapján indexeli az adatokat. |