Görüntü işleme özellikli sohbet modeli kavramları
Görüntü işleme özellikli sohbet modelleri, OpenAI tarafından geliştirilen ve görüntüleri analiz edip bunlarla ilgili sorulara metinsel yanıtlar sağlayabilen büyük çok modüllü modellerdir (LMM). Bunlar hem doğal dil işleme hem de görsel anlama özelliklerini içerir. Görüntü işleme özellikli mevcut modeller GPT-4 Turbo ve Görüntü İşleme, GPT-4o ve GPT-4o-mini modelleridir. Bu kılavuz, özellikleri ve sınırlamaları hakkında ayrıntılı bilgi sağlar.
Görüntü işleme özellikli sohbet modellerini denemek için hızlı başlangıç bölümüne bakın.
Görüntü işleme özellikli sohbetler
Görüntü işleme özellikli modeller, karşıya yüklediğiniz görüntülerde neler olduğuyla ilgili genel soruları yanıtlar.
Özel fiyatlandırma bilgileri
Önemli
Fiyatlandırma ayrıntıları gelecekte değiştirilebilir.
Görüntü işleme özellikli modeller, diğer Azure OpenAI sohbet modelleri gibi ücret tahakkuk eder. Fiyatlandırma sayfasında ayrıntılı olarak belirtilen istemler ve tamamlamalar için belirteç başına ücret ödersiniz. Temel ücretler ve ek özellikler burada özetlenmiştir:
Vision özellikli GPT-4 Turbo için Temel Fiyatlandırma:
- Giriş: 1000 belirteç başına 0,01 ABD doları
- Çıkış: 1000 belirteç başına 0,03 ABD doları
Metin ve görüntülerin belirteçlere nasıl çevrildiği hakkında bilgi için genel bakışın Belirteçler bölümüne bakın.
Örnek resim fiyat hesaplaması
Önemli
Aşağıdaki içerik yalnızca bir örnektir ve fiyatlar gelecekte değişebilir.
Tipik bir kullanım örneği için hem görünür nesneler hem de metin içeren bir görüntü ve 100 belirteçli bir istem girişi alın. Hizmet istemi işlediğinde 100 çıkış belirteci oluşturur. Görüntüde hem metin hem de nesneler algılanabilir. Bu işlemin fiyatı şöyle olacaktır:
Kalem | Ayrıntı | Maliyet |
---|---|---|
Metin istemi girişi | 100 metin belirteci | 0,001 ABD doları |
Örnek görüntü girişi (bkz. Görüntü belirteçleri) | 170 + 85 görüntü belirteci | 0,00255 USD |
OCR için gelişmiş eklenti özellikleri | $1,50 / 1000 işlem | 0,0015 USD |
Nesne Topraklama için gelişmiş eklenti özellikleri | $1,50 / 1000 işlem | 0,0015 USD |
Çıkış Belirteçleri | 100 belirteç (varsayılır) | 0,003 ABD doları |
Toplam | 0,00955 USD |
Giriş sınırlamaları
Bu bölümde, görüntü işleme özellikli sohbet modellerinin sınırlamaları açıklanmaktadır.
Görüntü desteği
- Maksimum giriş görüntüsü boyutu: Giriş görüntülerinin boyut üst sınırı 20 MB ile sınırlıdır.
- Düşük çözünürlük doğruluğu: Görüntüler "düşük çözünürlük" ayarı kullanılarak analiz edildiğinde, daha hızlı yanıtlara olanak tanır ve belirli kullanım örnekleri için daha az giriş belirteci kullanır. Ancak bu, görüntüdeki nesne ve metin tanımanın doğruluğunu etkileyebilir.
- Görüntü sohbeti kısıtlaması: Azure AI Foundry portalında veya API'de görüntüleri karşıya yüklediğinizde, sohbet araması başına 10 resim sınırı vardır.
Sonraki adımlar
- Hızlı başlangıcı izleyerek görüntü özellikli modelleri kullanmaya başlayın.
- API'lere daha ayrıntılı bir bakış için nasıl yapılır kılavuzunu izleyin.
- Tamamlamalar ve eklemeler API başvurusuna bakın