Aracılığıyla paylaş


Görüntü işleme özellikli sohbet modeli kavramları

Görüntü işleme özellikli sohbet modelleri, OpenAI tarafından geliştirilen ve görüntüleri analiz edip bunlarla ilgili sorulara metinsel yanıtlar sağlayabilen büyük çok modüllü modellerdir (LMM). Bunlar hem doğal dil işleme hem de görsel anlama özelliklerini içerir. Görüntü işleme özellikli mevcut modeller GPT-4 Turbo ve Görüntü İşleme, GPT-4o ve GPT-4o-mini modelleridir. Bu kılavuz, özellikleri ve sınırlamaları hakkında ayrıntılı bilgi sağlar.

Görüntü işleme özellikli sohbet modellerini denemek için hızlı başlangıç bölümüne bakın.

Görüntü işleme özellikli sohbetler

Görüntü işleme özellikli modeller, karşıya yüklediğiniz görüntülerde neler olduğuyla ilgili genel soruları yanıtlar.

Özel fiyatlandırma bilgileri

Önemli

Fiyatlandırma ayrıntıları gelecekte değiştirilebilir.

Görüntü işleme özellikli modeller, diğer Azure OpenAI sohbet modelleri gibi ücret tahakkuk eder. Fiyatlandırma sayfasında ayrıntılı olarak belirtilen istemler ve tamamlamalar için belirteç başına ücret ödersiniz. Temel ücretler ve ek özellikler burada özetlenmiştir:

Vision özellikli GPT-4 Turbo için Temel Fiyatlandırma:

  • Giriş: 1000 belirteç başına 0,01 ABD doları
  • Çıkış: 1000 belirteç başına 0,03 ABD doları

Metin ve görüntülerin belirteçlere nasıl çevrildiği hakkında bilgi için genel bakışın Belirteçler bölümüne bakın.

Örnek resim fiyat hesaplaması

Önemli

Aşağıdaki içerik yalnızca bir örnektir ve fiyatlar gelecekte değişebilir.

Tipik bir kullanım örneği için hem görünür nesneler hem de metin içeren bir görüntü ve 100 belirteçli bir istem girişi alın. Hizmet istemi işlediğinde 100 çıkış belirteci oluşturur. Görüntüde hem metin hem de nesneler algılanabilir. Bu işlemin fiyatı şöyle olacaktır:

Kalem Ayrıntı Maliyet
Metin istemi girişi 100 metin belirteci 0,001 ABD doları
Örnek görüntü girişi (bkz. Görüntü belirteçleri) 170 + 85 görüntü belirteci 0,00255 USD
OCR için gelişmiş eklenti özellikleri $1,50 / 1000 işlem 0,0015 USD
Nesne Topraklama için gelişmiş eklenti özellikleri $1,50 / 1000 işlem 0,0015 USD
Çıkış Belirteçleri 100 belirteç (varsayılır) 0,003 ABD doları
Toplam 0,00955 USD

Giriş sınırlamaları

Bu bölümde, görüntü işleme özellikli sohbet modellerinin sınırlamaları açıklanmaktadır.

Görüntü desteği

  • Maksimum giriş görüntüsü boyutu: Giriş görüntülerinin boyut üst sınırı 20 MB ile sınırlıdır.
  • Düşük çözünürlük doğruluğu: Görüntüler "düşük çözünürlük" ayarı kullanılarak analiz edildiğinde, daha hızlı yanıtlara olanak tanır ve belirli kullanım örnekleri için daha az giriş belirteci kullanır. Ancak bu, görüntüdeki nesne ve metin tanımanın doğruluğunu etkileyebilir.
  • Görüntü sohbeti kısıtlaması: Azure AI Foundry portalında veya API'de görüntüleri karşıya yüklediğinizde, sohbet araması başına 10 resim sınırı vardır.

Sonraki adımlar