Aracılığıyla paylaş


Azure Logic Apps'te iş akışları için içeriği ayrıştırma veya öbekleme (Önizleme)

Şunlar için geçerlidir: Azure Logic Apps (Tüketim + Standart)

Önemli

Bu özellik önizleme aşamasındadır ve Microsoft Azure Önizlemeleri için Ek Kullanım Koşulları'na tabidir.

Bazen bazı eylemlerle bu içeriği kullanabilmeniz için içeriği sözcükler veya karakter öbekleri olan belirteçlere dönüştürmeniz veya büyük bir belgeyi daha küçük parçalara bölmeniz gerekir. Örneğin, Azure AI Search veya Azure OpenAI eylemleri belirteçli giriş bekler ve yalnızca sınırlı sayıda belirteci işleyebilir.

Bu senaryolar için, mantıksal uygulama iş akışınızda Belgeyi ayrıştırma ve Öbek metni adlı Veri İşlemleri eylemlerini kullanın. Bu eylemler sırasıyla PDF belgesi, CSV dosyası, Excel dosyası gibi içerikleri belirteçli dize çıkışına dönüştürür ve ardından dizeyi belirteç sayısına göre parçalara ayırır. Daha sonra bu çıkışlara başvurabilir ve iş akışınızda sonraki eylemlerle kullanabilirsiniz.

İpucu

Daha fazla bilgi edinmek için Azure Copilot'a şu soruları sorabilirsiniz:

  • Yapay zekada belirteç nedir?
  • Belirteçli giriş nedir?
  • Belirteçli dize çıkışı nedir?
  • Yapay zekada ayrıştırma nedir?
  • Yapay zekada öbekleme nedir?

Azure Copilot'u bulmak için Azure portalı araç çubuğunda Copilot'u seçin.

Bu nasıl yapılır kılavuzu, iş akışınızda bu işlemlerin nasıl ekleneceğini ve ayarlandığını gösterir.

Bilinen sorunlar ve sınırlamalar

Belgeyi ayrıştırma ve Öbek metin eylemleri şu anda ana bilgisayar dosyalarını ve Sanal Depolama Erişim Yöntemi (VSAM) dosyaları gibi orta ölçekli ikili dosyaları desteklemez. Ancak Standart iş akışlarıyla çalışıyorsanız, bunun yerine Konak Dosyası İçeriğini Ayrıştır adlı IBM Konak Dosyası yerleşik eylemini kullanabilirsiniz.

Önkoşullar

  • Bir Azure hesabı ve aboneliği Azure aboneliğiniz yoksa ücretsiz bir Azure hesabı için kaydolun.

  • Bir belgeyi ayrıştırma ve Öbek metin işlemleri yalnızca eylemler olarak kullanılabildiğinden, mevcut tetikleyiciye sahip bir Tüketim veya Standart mantıksal uygulama iş akışı. Ayrıştırmak veya öbek oluşturmak istediğiniz içeriği alan eylemin bu veri işlemlerinden önce ulaştığından emin olun.

Belgeyi ayrıştırma

Belgeyi ayrıştır eylemi PDF belgesi, CSV dosyası, Excel dosyası vb. gibi içerikleri belirteçli dizeye dönüştürür. Bu örnekte, iş akışınızın Http isteği alındığında adlı İstek tetikleyicisiyle başladığını varsayalım. Bu tetikleyici, Azure işlevi, başka bir mantıksal uygulama iş akışı gibi başka bir bileşenden gönderilen HTTP isteğini almayı bekler. HTTP isteği, iş akışının alıp ayrıştırmak için kullanabileceği yeni bir karşıya yüklenen belgenin URL'sini içerir. HTTP eylemi tetikleyiciyi hemen izler ve belgenin URL'sine bir HTTP isteği gönderir ve depolama konumundaki belge içeriğiyle birlikte döndürür.

Azure Blob Depolama, SharePoint, OneDrive, Dosya Sistemi, FTP gibi başka içerik kaynakları kullanıyorsanız, bu kaynaklar için tetikleyicilerin kullanılabilir olup olmadığını de kontrol edebilirsiniz. Ayrıca, bu kaynakların içeriğini almak için eylemlerin kullanılabilir olup olmadığını de kontrol edebilirsiniz. Daha fazla bilgi için bkz . Yerleşik işlemler ve Yönetilen bağlayıcılar.

  1. Azure portalında mantıksal uygulama kaynağınızı ve iş akışınızı tasarımcıda açın.

  2. Mevcut tetikleyici ve eylemlerin altında, belgeyi iş akışınıza Ayrıştır adlı Veri İşlemleri eylemini eklemek için bu genel adımları izleyin.

  3. Tasarımcıda Belge ayrıştır eylemini seçin.

  4. Eylem bilgileri bölmesi açıldıktan sonra, Parametreler sekmesindeki Belge İçeriği özelliğinde şu adımları izleyerek ayrıştırılacak içeriği belirtin:

    1. Belge İçeriği kutusunun içini seçin.

      Dinamik içerik listesi (şimşek simgesi) ve ifade düzenleyicisi (işlev simgesi) seçenekleri görüntülenir.

      • Önceki bir eylemden çıkışı seçmek için dinamik içerik listesini seçin.

      • Önceki bir eylemin çıkışını işleyen bir ifade oluşturmak için ifade düzenleyicisini seçin.

      Bu örnek, dinamik içerik listesi için şimşek simgesini seçerek devam eder.

    2. Dinamik içerik listesi açıldıktan sonra, önceki bir işlemden istediğiniz çıkışı seçin.

      Bu örnekte, Belge ayrıştır eylemi HTTP eyleminden Gövde çıkışına başvurur.

      Açık dinamik içerik listesi ve HTTP eyleminden seçilen Gövde çıkışı ile belgeyi ayrıştır adlı bir eylemin bulunduğu iş akışı tasarımcıyı gösteren ekran görüntüsü.

      Gövde çıkışı artık Belge İçeriği kutusunda görünür:

      Belgeyi ayrıştırma adlı eylemde Gövde çıkışı olan örnek iş akışını gösteren ekran görüntüsü.

  5. Belgeyi ayrıştır eyleminin altında, belirteçli dize çıkışıyla çalışmak istediğiniz eylemleri (örneğin, bu kılavuzun daha sonra açıkladığı Öbek metni) ekleyin.

Belgeyi ayrıştırma - Başvuru

Parametreler

Veri Akışı Adı Değer Veri türü Açıklama Sınır
Belge İçeriği < içerik ayrıştırma> Tümü Ayrıştıracak içerik. Hiçbiri

Çıkışlar

Veri Akışı Adı Veri türü Açıklama
Ayrıştırılan sonuç metni Dize dizisi Dize dizisi.
Ayrıştırılan sonuç Object Ayrıştırılan metnin tamamını içeren bir nesne.

Öbek metni

Öbek metin eylemi, sonraki eylemlerin geçerli iş akışında daha kolay kullanılması için içeriği daha küçük parçalara ayırır. Aşağıdaki adımlar, Belgeyi ayrıştır bölümünden örnek üzerinde oluşturulur ve belirteçli, küçük içerik öbekleri bekleyen Azure AI işlemleriyle kullanılmak üzere belirteç dizesi çıktısını böler.

Not

Öbekleme kullanan önceki eylemler Öbek metin eylemini etkilemez ve Öbek metin eylemi öbek kullanan sonraki eylemleri etkilemez.

  1. Azure portalında mantıksal uygulama kaynağınızı ve iş akışınızı tasarımcıda açın.

  2. Belge ayrıştır eyleminin altında, Öbek metni adlı Veri İşlemleri eylemini eklemek için bu genel adımları izleyin.

  3. Tasarımcıda Öbek metni eylemini seçin.

  4. Eylem bilgileri bölmesi açıldıktan sonra, Parametreler sekmesindeki ÖbekLeme Stratejisi özelliği için, henüz seçili değilse öbekleme yöntemi olarak TokenSize'ı seçin.

    Strateji Açıklama
    TokenSize Belirtilen içeriği belirteç sayısına göre bölün.
  5. Stratejiyi seçtikten sonra, öbekleme içeriğini belirtmek için Metin kutusunun içini seçin.

    Dinamik içerik listesi (şimşek simgesi) ve ifade düzenleyicisi (işlev simgesi) seçenekleri görüntülenir.

    • Önceki bir eylemden çıkışı seçmek için dinamik içerik listesini seçin.

    • Önceki bir eylemin çıkışını işleyen bir ifade oluşturmak için ifade düzenleyicisini seçin.

    Bu örnek, dinamik içerik listesi için şimşek simgesini seçerek devam eder.

    1. Dinamik içerik listesi açıldıktan sonra, önceki bir işlemden istediğiniz çıkışı seçin.

      Bu örnekte Öbek metni eylemi, Belgeyi ayrıştır eyleminden ayrıştırılan sonuç metni çıkışına başvurur.

      İş akışı tasarımcısı, açık dinamik içerik listesi içeren Öbek metni adlı eylem ve Belge ayrıştır eyleminden seçilen çıkışı gösteren ekran görüntüsü.

      Metin kutusu artık Ayrıştırılmış sonuç eylemi çıkışını gösterir:

      Öbek metni adlı eylemde seçili ayrıştırılmış sonuç metni çıkışıyla örnek iş akışını gösteren ekran görüntüsü.

  6. Seçtiğiniz stratejiye ve senaryoya göre Öbek metin eyleminin kurulumunu tamamlayın. Daha fazla bilgi için bkz . Öbek metni - Başvuru.

Artık Azure AI eylemleri gibi belirteçli girişi bekleyen ve kullanan başka eylemler eklediğinizde, giriş içeriği daha kolay kullanım için biçimlendirilir.

Öbek metni - Başvuru

Parametreler

Veri Akışı Adı Değer Veri türü Açıklama Sınırlar
ÖbekLeme Stratejisi TokenSize Dize sabit listesi İçeriği belirteç sayısına göre bölün.

Varsayılan: TokenSize
Uygulanamaz
Metin < içerik-öbek> Tümü Öbeklene içerik. Bkz. Sınırlar ve yapılandırma başvuru kılavuzu
EncodingModel < kodlama yöntemi> Dize sabit listesi Kullanılacak kodlama modeli:

- Varsayılan: cl100k_base (gpt4, gpt-3.5-turbo, gpt-35-turbo)

- r50k_base (gpt-3)

- p50k_base (gpt-3)

- p50k_edit (gpt-3)

- cl200k_base (gpt-4o)

Daha fazla bilgi için bkz . OpenAI - Modellere genel bakış.
Uygulanamaz
TokenSize < öbek başına max-tokens> Tamsayı İçerik öbekleri başına en fazla belirteç sayısı.

Varsayılan: Yok
En Az: 1
Maksimum: 8000
PageOverlapLength < çakışan karakter sayısı> Tamsayı Önceki öbek sonundan sonraki öbeke eklenecek karakter sayısı. Bu ayar, içeriği öbeklere bölerken önemli bilgileri kaybetmemenize yardımcı olur ve öbekler arasında sürekliliği ve bağlamı korur.

Varsayılan: 0 - Çakışan karakter yok.
Minimum: 0

İpucu

Daha fazla bilgi edinmek için Azure Copilot'a şu soruları sorabilirsiniz:

  • Öbeklemede PageOverlapLength nedir?
  • Azure AI'de kodlama nedir?

Azure Copilot'u bulmak için Azure portalı araç çubuğunda Copilot'u seçin.

Çıkışlar

Veri Akışı Adı Veri türü Açıklama
Öbeklenmiş sonuç Metin öğeleri Dize dizisi Dize dizisi.
Öbeklenmiş sonuç Metin öğeleri Öğesi String Dizideki tek bir dize.
Öbeklenmiş sonuç Object Öbeklenmiş metnin tamamını içeren bir nesne.

Örnek iş akışı

Aşağıdaki örnek, herhangi bir kaynaktan veri almak için eksiksiz bir iş akışı düzeni oluşturan diğer eylemleri içerir:

Örnek iş akışının tamamını gösteren ekran görüntüsü.

Adımlar Görev Temel alınan işlem Açıklama
1 Yeni içeriği bekleyin veya denetleyin. HTTP isteği alındığında Zamanlanmış bir yinelenme temelinde veya sırasıyla belirli olaylara yanıt olarak yeni verilerin gelmesini yoklayan veya bekleyen bir tetikleyici. Böyle bir olay, Azure Blob Depolama, SharePoint, OneDrive, Dosya Sistemi, FTP gibi belirli bir depolama sistemine yüklenmiş yeni bir dosya olabilir.

Bu örnekte İstek tetikleyicisi işlemi, başka bir uç noktadan gönderilen bir HTTP veya HTTPS isteğini bekler. İstek, karşıya yüklenen yeni bir belgenin URL'sini içerir.
2 İçeriği alın. HTTP Tetikleyici çıkışından dosya URL'sini kullanarak karşıya yüklenen belgeyi alan bir HTTP eylemi.
3 Belge ayrıntılarını oluşturma. Compose Çeşitli öğeleri birleştirir veri işlemleri eylemi.

Bu örnek, belgeyle ilgili anahtar-değer bilgilerini birleştirir.
4 Belirteç dizesi oluşturun. Belgeyi ayrıştırma Oluştur eyleminin çıkışını kullanarak belirteçli bir dize oluşturan Veri İşlemleri eylemi.
5 İçerik öbekleri oluşturun. Öbek metni İçerik öbekleri başına belirteç sayısına göre belirteç dizesini parçalara ayıran Veri İşlemleri eylemi.
6 Belirteçli ve öbeklenmiş metni JSON'a dönüştürün. JSON Ayrıştırma Öbeklenmiş çıkışı bir JSON dizisine dönüştüren Veri İşlemleri eylemi.
7 JSON dizi öğeleri'ne tıklayın. Seç JSON dizisinden birden çok öğe seçen Veri İşlemleri eylemi.
8 Eklemeleri oluşturun. Birden çok ekleme alma Her JSON dizi öğesi için eklemeler oluşturan bir Azure OpenAI eylemi.
9 Eklemeleri ve diğer bilgileri seçin. Seç Eklemeleri ve diğer belge bilgilerini seçen Veri İşlemleri eylemi.
10 Verilerin dizinini oluşturun. Belgeleri dizine oluşturma Seçilen her eklemeye göre verilerin dizinini oluşturan bir Azure AI Arama eylemi.