Udostępnij za pośrednictwem


Analizowanie lub fragmentowanie zawartości dla przepływów pracy w usłudze Azure Logic Apps (wersja zapoznawcza)

Dotyczy: Azure Logic Apps (Zużycie + Standardowa)

Ważne

Ta funkcja jest dostępna w wersji zapoznawczej i podlega dodatkowym warunkom użytkowania wersji zapoznawczej platformy Microsoft Azure.

Czasami trzeba przekonwertować zawartość na tokeny, które są wyrazami lub fragmentami znaków, albo podzielić duży dokument na mniejsze elementy, zanim będzie można użyć tej zawartości z niektórymi akcjami. Na przykład akcje usługi Azure AI Search lub Azure OpenAI oczekują tokenizowanych danych wejściowych i mogą obsługiwać tylko ograniczoną liczbę tokenów.

W tych scenariuszach użyj akcji Operacje danych o nazwie Przeanalizuj dokument i tekst fragmentu w przepływie pracy aplikacji logiki. Te akcje przekształcają odpowiednio zawartość, taką jak dokument PDF, plik CSV, plik programu Excel itd., na tokenizowane dane wyjściowe ciągu, a następnie podziel ciąg na fragmenty na podstawie liczby tokenów. Następnie możesz odwoływać się do tych danych wyjściowych i używać ich z kolejnymi akcjami w przepływie pracy.

Napiwek

Aby dowiedzieć się więcej, możesz zadać następujące pytania dotyczące platformy Azure Copilot:

  • Co to jest token w sztucznej inteligencji?
  • Co to są tokenizowane dane wejściowe?
  • Co to są dane wyjściowe tokenizowanego ciągu?
  • Co to jest analizowanie w sztucznej inteligencji?
  • Co to jest fragmentowanie w sztucznej inteligencji?

Aby znaleźć narzędzie Azure Copilot, na pasku narzędzi witryny Azure Portal wybierz pozycję Copilot.

W tym przewodniku z instrukcjami pokazano, jak dodać i skonfigurować te operacje w przepływie pracy.

Znane problemy i ograniczenia

Obecnie akcje analizowania dokumentu i fragmentu tekstu nie obsługują plików hosta, na przykład plików mainframe i plików binarnych midrange, takich jak pliki metody dostępu do magazynu wirtualnego (VSAM). Jeśli jednak pracujesz z przepływami pracy w warstwie Standardowa, możesz zamiast tego użyć wbudowanej akcji pliku hosta IBM o nazwie Przeanalizuj zawartość pliku hosta.

Wymagania wstępne

  • Konto i subskrypcja platformy Azure. Jeśli nie masz subskrypcji platformy Azure, zarejestruj się w celu założenia bezpłatnego konta platformy Azure.

  • Przepływ pracy aplikacji logiki Zużycie lub Standardowa z istniejącym wyzwalaczem, ponieważ analizowanie dokumentu i operacji tekstowych fragmentów jest dostępne tylko jako akcje. Upewnij się, że akcja pobierająca zawartość, którą chcesz przeanalizować lub fragment poprzedza te operacje danych.

Analizowanie dokumentu

Akcja Analizowanie dokumentu konwertuje zawartość, taką jak dokument PDF, plik CSV, plik programu Excel itd., na ciąg tokenizowany. W tym przykładzie załóżmy, że przepływ pracy rozpoczyna się od wyzwalacza Żądania o nazwie Po odebraniu żądania HTTP. Ten wyzwalacz oczekuje na odebranie żądania HTTP wysłanego z innego składnika, takiego jak funkcja platformy Azure, inny przepływ pracy aplikacji logiki itd. Żądanie HTTP zawiera adres URL nowego przekazanego dokumentu, który jest dostępny dla przepływu pracy w celu pobrania i przeanalizowana. Akcja HTTP natychmiast następuje po wyzwalaczu i wysyła żądanie HTTP do adresu URL dokumentu i zwraca zawartość dokumentu z lokalizacji przechowywania.

Jeśli używasz innych źródeł zawartości, takich jak Azure Blob Storage, SharePoint, OneDrive, System plików, FTP itd., możesz sprawdzić, czy wyzwalacze są dostępne dla tych źródeł. Możesz również sprawdzić, czy akcje są dostępne do pobrania zawartości dla tych źródeł. Aby uzyskać więcej informacji, zobacz Wbudowane operacje i Łączniki zarządzane.

  1. W witrynie Azure Portal otwórz zasób aplikacji logiki i przepływ pracy w projektancie.

  2. W obszarze istniejącego wyzwalacza i akcji wykonaj następujące ogólne kroki, aby dodać akcję Operacje danych o nazwie Przeanalizuj dokument do przepływu pracy.

  3. W projektancie wybierz akcję Przeanalizuj dokument .

  4. Po otworze okienka informacji o akcji na karcie Parametry we właściwości Zawartość dokumentu określ zawartość do przeanalizowana, wykonując następujące kroki:

    1. Wybierz wewnątrz pola Zawartość dokumentu.

      Pojawią się opcje listy zawartości dynamicznej (ikona błyskawicy) i edytora wyrażeń (ikona funkcji).

      • Aby wybrać dane wyjściowe z poprzedniej akcji, wybierz listę zawartości dynamicznej.

      • Aby utworzyć wyrażenie, które manipuluje danymi wyjściowymi z poprzedniej akcji, wybierz edytor wyrażeń.

      Ten przykład będzie kontynuowany, wybierając ikonę błyskawic dla listy zawartości dynamicznej.

    2. Po otworze listy zawartości dynamicznej wybierz dane wyjściowe z poprzedniej operacji.

      W tym przykładzie akcja Przeanalizuj dokument odwołuje się do danych wyjściowych Treści z akcji HTTP .

      Zrzut ekranu przedstawia projektanta przepływu pracy, który zawiera akcję o nazwie Przeanalizuj dokument z otwartą listą zawartości dynamicznej i wybranymi danymi wyjściowymi Treści z akcji HTTP.

      Dane wyjściowe Treść są teraz wyświetlane w polu Zawartość dokumentu:

      Zrzut ekranu przedstawiający przykładowy przepływ pracy z danymi wyjściowymi treści w akcji o nazwie Przeanalizuj dokument.

  5. W obszarze Przeanalizuj akcję dokumentu dodaj akcje, które chcesz pracować z danymi wyjściowymi tokenizowanego ciągu, na przykład tekst fragmentu, który opisano w dalszej części tego przewodnika.

Analizowanie dokumentu — odwołanie

Parametry

Nazwa/nazwisko Wartość Typ danych opis Limit
Zawartość dokumentu < content-to-parse> Dowolne Zawartość do przeanalizowana. Brak

Dane wyjściowe

Nazwisko Typ danych opis
Przeanalizowany tekst wyniku Tablica ciągów Tablica ciągów.
Przeanalizowany wynik Objekt Obiekt zawierający cały przeanalizowany tekst.

Tekst fragmentu

Akcja fragmentowania tekstu dzieli zawartość na mniejsze fragmenty dla kolejnych akcji w celu łatwiejszego użycia w bieżącym przepływie pracy. Poniższe kroki opierają się na przykładzie z sekcji Analizowanie dokumentu i dzieli dane wyjściowe ciągu tokenu do użycia z operacjami sztucznej inteligencji platformy Azure, które oczekują tokenizowanych, małych fragmentów zawartości.

Uwaga

Poprzednie akcje korzystające z fragmentowania nie wpływają na akcję Fragment tekstu ani nie wpływają na akcję Fragment tekstu, ani na kolejne akcje, które używają fragmentowania.

  1. W witrynie Azure Portal otwórz zasób aplikacji logiki i przepływ pracy w projektancie.

  2. W obszarze Analizowanie akcji dokumentu wykonaj następujące ogólne kroki, aby dodać akcję Operacje danych o nazwie Tekst fragmentu.

  3. W projektancie wybierz akcję Fragment tekstu .

  4. Po otworze okienka informacji o akcji na karcie Parametry dla właściwości Strategia fragmentowania wybierz pozycję TokenSize jako metodę fragmentowania, jeśli nie została jeszcze wybrana.

    Strategia opis
    Rozmiar tokenu Podziel określoną zawartość na podstawie liczby tokenów.
  5. Po wybraniu strategii wybierz wewnątrz pola Tekstowe , aby określić zawartość fragmentu.

    Pojawią się opcje listy zawartości dynamicznej (ikona błyskawicy) i edytora wyrażeń (ikona funkcji).

    • Aby wybrać dane wyjściowe z poprzedniej akcji, wybierz listę zawartości dynamicznej.

    • Aby utworzyć wyrażenie, które manipuluje danymi wyjściowymi z poprzedniej akcji, wybierz edytor wyrażeń.

    Ten przykład będzie kontynuowany, wybierając ikonę błyskawic dla listy zawartości dynamicznej.

    1. Po otworze listy zawartości dynamicznej wybierz dane wyjściowe z poprzedniej operacji.

      W tym przykładzie akcja fragmentu tekstu odwołuje się do danych wyjściowych przeanalizowanego tekstu wynikowego z akcji Przeanalizuj dokument .

      Zrzut ekranu przedstawiający projektanta przepływu pracy, akcję o nazwie Tekst fragmentu z otwartą listą zawartości dynamicznej i wybrane dane wyjściowe z akcji Przeanalizuj dokument.

      W polu Tekst są teraz wyświetlane dane wyjściowe akcji przeanalizowanej wyniku:

      Zrzut ekranu przedstawiający przykładowy przepływ pracy z wybranymi przeanalizowanymi danymi wyjściowymi tekstu wynikowego w akcji o nazwie Tekst fragmentu.

  6. Ukończ konfigurację akcji tekstowej fragmentu na podstawie wybranej strategii i scenariusza. Aby uzyskać więcej informacji, zobacz Tekst fragmentu — odwołanie.

Teraz po dodaniu innych akcji, które oczekują tokenizowanego danych wejściowych, takich jak akcje sztucznej inteligencji platformy Azure, zawartość wejściowa jest sformatowana w celu łatwiejszego użycia.

Tekst fragmentu — odwołanie

Parametry

Nazwa/nazwisko Wartość Typ danych opis Limity
Strategia fragmentowania Rozmiar tokenu Wyliczenie ciągów Podziel zawartość na podstawie liczby tokenów.

Ustawienie domyślne: TokenSize
Nie dotyczy
Tekst < zawartość do fragmentu> Dowolne Zawartość do fragmentowania. Zobacz Przewodnik po limitach i konfiguracji
Model kodowania < metoda kodowania> Wyliczenie ciągów Model kodowania do użycia:

- Domyślnie: cl100k_base (gpt4, gpt-3,5-turbo, gpt-35-turbo)

- r50k_base (gpt-3)

- p50k_base (gpt-3)

- p50k_edit (gpt-3)

- cl200k_base (gpt-4o)

Aby uzyskać więcej informacji, zobacz OpenAI — Modele — omówienie.
Nie dotyczy
Rozmiar tokenu < max-tokens-per-chunk> Integer Maksymalna liczba tokenów na fragment zawartości.

Ustawienie domyślne: Brak
Minimum: 1
Maksimum: 8000
PageOverlapLength < liczba nakładających się znaków> Integer Liczba znaków z końca poprzedniego fragmentu do uwzględnienia w następnym fragmentzie. To ustawienie pomaga uniknąć utraty ważnych informacji podczas dzielenia zawartości na fragmenty i zachowuje ciągłość i kontekst między fragmenty.

Ustawienie domyślne: 0 — nie istnieją nakładające się znaki.
Minimum: 0

Napiwek

Aby dowiedzieć się więcej, możesz zadać następujące pytania dotyczące platformy Azure Copilot:

  • Co to jest PageOverlapLength we fragmentowaniu?
  • Co to jest kodowanie w usłudze Azure AI?

Aby znaleźć narzędzie Azure Copilot, na pasku narzędzi witryny Azure Portal wybierz pozycję Copilot.

Dane wyjściowe

Nazwisko Typ danych opis
Fragmentowane elementy tekstowe wyniku Tablica ciągów Tablica ciągów.
Element elementów tekstowych wynikowych fragmentowanych String Pojedynczy ciąg w tablicy.
Wynik fragmentowany Objekt Obiekt, który zawiera cały fragmentowany tekst.

Przykładowy przepływ pracy

Poniższy przykład zawiera inne akcje, które tworzą kompletny wzorzec przepływu pracy w celu pozyskiwania danych z dowolnego źródła:

Zrzut ekranu przedstawia kompletny przykładowy przepływ pracy.

Krok Zadanie Operacja bazowa opis
1 Zaczekaj lub sprawdź nową zawartość. Po odebraniu żądania HTTP Wyzwalacz, który sonduje lub czeka na nadejście nowych danych na podstawie zaplanowanego cyklu lub odpowiednio w odpowiedzi na określone zdarzenia. Takie zdarzenie może być nowym plikiem przekazanym do określonego systemu magazynu, takiego jak Azure Blob Storage, SharePoint, OneDrive, System plików, FTP itd.

W tym przykładzie operacja wyzwalacza żądania czeka na żądanie HTTP lub HTTPS wysłane z innego punktu końcowego. Żądanie zawiera adres URL nowego przekazanego dokumentu.
2 Pobierz zawartość. HTTP Akcja HTTP , która pobiera przekazany dokument przy użyciu adresu URL pliku z danych wyjściowych wyzwalacza.
3 Utwórz szczegóły dokumentu. Redaguj Akcja Operacje na danych, która łączy różne elementy.

Ten przykład łączy informacje o klucz-wartość dokumentu.
100 Utwórz ciąg tokenu. Analizowanie dokumentu Akcja Operacje na danych, która tworzy tokenizowany ciąg przy użyciu danych wyjściowych akcji Redaguj.
5 Tworzenie fragmentów zawartości. Tekst fragmentu Akcja Operacje na danych dzieląca ciąg tokenu na fragmenty na podstawie liczby tokenów na fragment zawartości.
6 Konwertowanie tokenizowanego i fragmentowanego tekstu na format JSON. Przeanalizuj dane JSON Akcja Operacje na danych, która konwertuje fragmentowane dane wyjściowe na tablicę JSON.
7 Wybierz pozycję Elementy tablicy JSON. Wybieranie Akcja Operacje na danych, która wybiera wiele elementów z tablicy JSON.
8 Wygeneruj osadzanie. Pobieranie wielu osadzania Akcja usługi Azure OpenAI , która tworzy osadzanie dla każdego elementu tablicy JSON.
9 Wybierz pozycję Osadzanie i inne informacje. Wybieranie Akcja Operacje na danych, która wybiera osadzanie i inne informacje o dokumencie.
10 Indeksowanie danych. Indeksowanie dokumentów Akcja usługi Azure AI Search , która indeksuje dane na podstawie każdego wybranego osadzania.