Verilerinizde Azure OpenAI

Makale
02/13/2025

Geliştiricilerin kişiselleştirilmiş yardımcı pilotlar (önizleme) oluşturmak için kurumsal verilerini bağlamasını, almalarını ve temel almalarını kolaylaştıran Verilerinizde Azure OpenAI hakkında bilgi edinmek için bu makaleyi kullanın. Kullanıcı kavramayı geliştirir, görev tamamlama sürecini hızlandırir, operasyonel verimliliği artırır ve karar alma sürecine yardımcı olur.

Verilerinizde Azure OpenAI nedir?

Verilerinizde Azure OpenAI, modelleri eğitmeye veya ince ayar yapmaya gerek kalmadan GPT-35-Turbo ve GPT-4 gibi gelişmiş yapay zeka modellerini kendi kurumsal verilerinizde çalıştırmanıza olanak tanır. Üzerinde sohbet edebilir ve verilerinizi daha doğru bir şekilde analiz edebilirsiniz. Belirlenen veri kaynaklarınızda bulunan en son bilgilere göre yanıtları destekleyecek kaynakları belirtebilirsiniz. Azure AI Foundry portalındaki SDK veya web tabanlı arabirim aracılığıyla REST API kullanarak Verilerinizde Azure OpenAI'ye erişebilirsiniz. Ayrıca gelişmiş bir sohbet çözümünü etkinleştirmek için verilerinize bağlanan bir web uygulaması oluşturabilir veya doğrudan Copilot Studio'da (önizleme) copilot olarak dağıtabilirsiniz.

Verilerinizde Azure OpenAI ile geliştirme

Örnek iş akışını gösteren diyagram.

Normalde, Verilerinizde Azure OpenAI ile kullanacağınız geliştirme süreci şu şekildedir:

Alma: Azure AI Foundry portalını veya alım API'sini kullanarak dosyaları karşıya yükleyin. Bu, verilerinizin kırılmasını, öbeklenmesini ve Azure OpenAI modelleri tarafından kullanılabilecek bir Azure AI Search örneğine katıştırılabilmesini sağlar. Desteklenen bir veri kaynağınız varsa doğrudan da bağlayabilirsiniz.
Geliştirme: Verilerinizde Azure OpenAI'yi denedikten sonra, çeşitli dillerde kullanılabilen kullanılabilir REST API ve SDK'ları kullanarak uygulamanızı geliştirmeye başlayın. Azure OpenAI hizmetine geçirmek için istemler ve arama amaçları oluşturur.
Çıkarım: Uygulamanız tercih ettiğiniz ortamda dağıtıldıktan sonra Azure OpenAI'ye istemler gönderir ve yanıt döndürmeden önce birkaç adım gerçekleştirir:
1. Amaç oluşturma: Hizmet, kullanıcının uygun yanıtı belirleme isteminin amacını belirler.
2. Alma: Hizmet, bağlı veri kaynağındaki kullanılabilir verilerin ilgili öbeklerini sorgulayarak alır. Örneğin, anlamsal veya vektör araması kullanarak. Alma işlemini etkilemek için katılık ve alınacak belge sayısı gibi parametreler kullanılır.
3. Filtreleme ve yeniden boyutlandırma: İlgiyi iyileştirmek için verileri sıralamak ve filtrelemek için alma adımındaki arama sonuçları iyileştirilir.
4. Yanıt oluşturma: Elde edilen veriler, sistem iletisi gibi diğer bilgilerle birlikte Büyük Dil Modeli'ne (LLM) gönderilir ve yanıt uygulamaya geri gönderilir.

Başlamak için Azure AI Foundry portalını kullanarak veri kaynağınızı bağlayın ve verilerinizle ilgili sorular sorup sohbet etmeye başlayın.

Veri kaynakları eklemek için Azure Rol tabanlı erişim denetimleri (Azure RBAC)

Verilerinizde Azure OpenAI'yi tam olarak kullanmak için bir veya daha fazla Azure RBAC rolü ayarlamanız gerekir. Daha fazla bilgi için bkz . Verilerinizde Azure OpenAI yapılandırması .

Veri biçimleri ve dosya türleri

Verileriniz Üzerinde Azure OpenAI aşağıdaki dosya türlerini destekler:

.txt
.md
.html
.docx
.pptx
.pdf

Karşıya yükleme sınırı vardır ve belge yapısı ve bunun modelden gelen yanıtların kalitesini nasıl etkileyebileceği hakkında bazı uyarılar vardır:

Desteklenmeyen bir biçimdeki verileri desteklenen bir biçime dönüştürüyorsanız dönüştürmeyi sağlayarak model yanıtının kalitesini iyileştirin:
- Önemli veri kaybına yol açmaz.
- Verilerinize beklenmeyen kirlilik eklemez.
Dosyalarınızın tablolar ve sütunlar veya madde işaretleri gibi özel biçimlendirmeleri varsa GitHub'da bulunan veri hazırlama betiğiyle verilerinizi hazırlayın.
Uzun metne sahip belgeler ve veri kümeleri için kullanılabilir veri hazırlama betiğini kullanmanız gerekir. Betik, modelin yanıtlarının daha doğru olması için verileri öbekler. Bu betik taranan PDF dosyalarını ve görüntülerini de destekler.

Desteklenen veri kaynakları

Verilerinizi karşıya yüklemek için bir veri kaynağına bağlanmanız gerekir. Verilerinizi bir Azure OpenAI modeliyle sohbet etmek için kullanmak istediğinizde, ilgili verilerin kullanıcı sorgularına göre bulunabilmesi için verileriniz bir arama dizininde öbek halinde bulunur.

Not

En iyi sonuçlar için verileriniz yapılandırılmamış metin olmalıdır. Metinsel olmayan yarı yapılandırılmış veya yapılandırılmış verileriniz varsa bunları metne dönüştürmeyi göz önünde bulundurun. Dosyalarınızın tablolar ve sütunlar veya madde işaretleri gibi özel biçimlendirmeleri varsa GitHub'da bulunan veri hazırlama betiğiyle verilerinizi hazırlayın.

MongoDB için sanal çekirdek tabanlı Azure Cosmos DB'deki Tümleşik Vektör Veritabanı, Verilerinizde Azure OpenAI ile tümleştirmeyi yerel olarak destekler.

Yerel makinenizden dosya yükleme (önizleme) veya blob depolama hesabında (önizleme) bulunan veriler gibi bazı veri kaynakları için Azure AI Search kullanılır. Aşağıdaki veri kaynaklarını seçtiğinizde verileriniz bir Azure AI Search dizinine alınır.

Azure AI Search aracılığıyla alınan veriler	Açıklama
Azure AI Arama	Verilerinizde Azure OpenAI ile mevcut bir Azure AI Arama dizinini kullanın.
Dosyaları karşıya yükleme (önizleme)	Azure Blob Depolama veritabanında depolanmak ve Azure AI Search'e almak için yerel makinenizden dosyaları karşıya yükleyin.
URL/Web adresi (önizleme)	URL'lerdeki web içeriği Azure Blob Depolama depolanır.
Azure Blob Depolama (önizleme)	Azure AI Search dizinine almak için Azure Blob Depolama dosyaları karşıya yükleyin.

Aşağıdakilerden birini yapmak istediğinizde Azure AI Search dizini kullanmayı düşünebilirsiniz:

Dizin oluşturma işlemini özelleştirin.
Diğer veri kaynaklarından veri alarak daha önce oluşturulan bir dizini yeniden kullanın.

Not

Var olan bir dizini kullanmak için en az bir aranabilir alanı olmalıdır.
CORS Kaynak Türüne İzin Ver seçeneğini olarak all , İzin verilen çıkış noktaları seçeneğini olarak *ayarlayın.
Arama dizininizde karmaşık alanlar olamaz.

Arama türleri

Verilerinizde Azure OpenAI, veri kaynağınızı eklerken kullanabileceğiniz aşağıdaki arama türlerini sağlar.

Anahtar sözcük araması
Anlamsal arama
Seçili bölgelerde kullanılabilen Ada ekleme modellerini kullanarak vektör araması

Vektör aramasını etkinleştirmek için, Azure OpenAI kaynağınızda mevcut bir ekleme modelinin dağıtılması gerekir. Verilerinizi bağlarken ekleme dağıtımınızı seçin ve ardından Veri yönetimi altındaki vektör arama türlerinden birini seçin. Veri kaynağı olarak Azure AI Search kullanıyorsanız dizinde bir vektör sütununun olduğundan emin olun.

Kendi dizininizi kullanıyorsanız, sorularınızı yanıtlarken eşlenecek alanları tanımlamak için veri kaynağınızı eklediğinizde alan eşlemesini özelleştirebilirsiniz. Alan eşlemesini özelleştirmek için veri kaynağınızı eklerken Veri Kaynağı sayfasında Özel alan eşlemesini kullan'ı seçin.

Önemli

Anlamsal arama ek fiyatlandırmaya tabidir. Anlamsal aramayı veya vektör aramasını etkinleştirmek için Temel veya daha yüksek SKU'yu seçmeniz gerekir. Daha fazla bilgi için bkz . fiyatlandırma katmanı farkı ve hizmet sınırları .
Bilgi alma ve model yanıtının kalitesini artırmaya yardımcı olmak için şu veri kaynağı dilleri için anlamsal aramayı etkinleştirmenizi öneririz: İngilizce, Fransızca, İspanyolca, Portekizce, İtalyanca, Almanya, Çince (Zh), Japonca, Korece, Rusça ve Arapça.

Arama seçeneği	Alma türü	Ek fiyatlandırma mı?	Sosyal haklar
anahtar sözcük	Anahtar sözcük araması	Ek fiyatlandırma yok.	İşleçlerle veya işleçler olmadan desteklenen herhangi bir dilde terimleri veya tümcecikleri kullanarak aranabilir alanlar üzerinde hızlı ve esnek sorgu ayrıştırma ve eşleştirme gerçekleştirir.
semantik	Anlamsal arama	Anlamsal arama kullanımı için ek fiyatlandırma.	İlk arama dereceleyicisi tarafından döndürülen sorgu terimlerinin ve belgelerin anlamsal anlamını anlamak için bir reranker (yapay zeka modelleriyle) kullanarak arama sonuçlarının duyarlığını ve ilgi düzeyini artırır
vektör	Vektör araması	Ekleme modelini çağırmak için Azure OpenAI hesabınızda ek fiyatlandırma .	İçeriğin vektör eklemelerine göre belirli bir sorgu girişine benzer belgeleri bulmanıza olanak tanır.
karma (vektör + anahtar sözcük)	Vektör arama ve anahtar sözcük arama karması	Ekleme modelini çağırmak için Azure OpenAI hesabınızda ek fiyatlandırma .	Vektör eklemelerini kullanarak vektör alanları üzerinde benzerlik araması gerçekleştirirken, terim sorgularını kullanarak alfasayısal alanlar üzerinde esnek sorgu ayrıştırma ve tam metin aramayı destekler.
karma (vektör + anahtar sözcük) + anlamsal	Vektör arama, anlamsal arama ve anahtar sözcük arama karması.	Azure OpenAI hesabınızda ekleme modelini çağırmak için ek fiyatlandırma ve anlamsal arama kullanımı için ek fiyatlandırma.	Karmaşık ve çeşitli bilgi alma senaryolarını işleyebilen zengin arama deneyimleri ve üretken yapay zeka uygulamaları oluşturmak için vektör ekleme, dil anlama ve esnek sorgu ayrıştırma özelliklerini kullanır.

Akıllı arama

Verilerinizde Azure OpenAI, verileriniz için akıllı arama özelliğini etkinleştirmiştir. Hem anlamsal arama hem de anahtar sözcük aramanız varsa semantik arama varsayılan olarak etkinleştirilir. Ekleme modelleriniz varsa akıllı arama varsayılan olarak karma + anlamsal arama olur.

Belge düzeyi erişim denetimi

Not

Veri kaynağınız olarak Azure AI Search'i seçtiğinizde belge düzeyinde erişim denetimi desteklenir.

Verilerinizde Azure OpenAI, Azure AI Search güvenlik filtreleri ile farklı kullanıcılar için yanıtlarda kullanılabilecek belgeleri kısıtlamanıza olanak tanır. Belge düzeyi erişimini etkinleştirdiğinizde, Azure AI Search'ten döndürülen ve yanıt oluşturmak için kullanılan arama sonuçları, kullanıcı Microsoft Entra grup üyeliğine göre kırpılır. Belge düzeyinde erişimi yalnızca mevcut Azure AI Search dizinlerinde etkinleştirebilirsiniz. Daha fazla bilgi için bkz . Veri ağınızda Azure OpenAI ve erişim yapılandırması .

Dizin alanı eşlemesi

Kendi dizininizi kullanıyorsanız Azure AI Foundry portalında, veri kaynağınızı eklerken soruları yanıtlamak için hangi alanları eşlemek istediğinizi tanımlamanız istenir. İçerik verileri için birden çok alan sağlayabilirsiniz ve kullanım örneğiniz ile ilgili metin içeren tüm alanları içermelidir.

Bu örnekte İçerik verileri ve Başlık ile eşlenen alanlar, soruları yanıtlamak için modele bilgi sağlar. Başlık , alıntı metnini başlıklandırmak için de kullanılır. Dosya adıyla eşlenen alan yanıtta alıntı adlarını oluşturur.

Bu alanların doğru bir şekilde eşleştirilmesi, modelin daha iyi yanıt ve alıntı kalitesine sahip olmasını sağlamaya yardımcı olur. Ayrıca parametresini fieldsMapping kullanarak API'de yapılandırabilirsiniz.

Sorgu yürütme için ek değer tabanlı ölçütler uygulamak istiyorsanız, REST API'deki parametresini filter kullanarak bir arama filtresi ayarlayabilirsiniz.

Veriler Azure AI aramasına nasıl alınır?

Eylül 2024 itibarıyla alım API'leri tümleşik vektörleştirmeye geçti. Bu güncelleştirme, mevcut API sözleşmelerini değiştirmez. Azure AI Search'ün yeni bir teklifi olan tümleşik vektörleştirme, giriş verilerini öbekleme ve ekleme için önceden oluşturulmuş becerileri kullanır. Azure OpenAI On Your Data alma hizmeti artık özel beceriler kullanmaz. Tümleşik vektörleştirmeye geçiş sonrasında, alma işlemi bazı değişikliklerden geçmiştir ve sonuç olarak yalnızca aşağıdaki varlıklar oluşturulur:

{job-id}-index
{job-id}-indexer, saatlik veya günlük bir zamanlama belirtilirse, aksi takdirde, dizin oluşturucu alma işleminin sonunda temizlenir.
{job-id}-datasource

Bu işlev artık doğal olarak Azure AI Search tarafından yönetildiğinden öbekler kapsayıcısı artık kullanılamaz.

Veri bağlantısı

Azure OpenAI, Azure AI Search ve Azure blob depolamadan bağlantının kimliğini nasıl doğrulamak istediğinizi seçmeniz gerekir. Sistem tarafından atanan yönetilen kimliği veya API anahtarını seçebilirsiniz. Kimlik doğrulama türü olarak API anahtarı seçildiğinde sistem, Azure AI Search, Azure OpenAI ve Azure Blob Depolama kaynaklarınıza bağlanmanız için API anahtarını otomatik olarak doldurur. Sistem tarafından atanan yönetilen kimlik seçildiğinde, kimlik doğrulaması sahip olduğunuz rol atamasını temel alır. Sistem tarafından atanan yönetilen kimlik , güvenlik için varsayılan olarak seçilir.

Sonraki düğmeyi seçtiğinizde, seçilen kimlik doğrulama yöntemini kullanmak için kurulumunuzu otomatik olarak doğrular. Bir hatayla karşılaşırsanız, kurulumunuzu güncelleştirmek için rol atamaları makalesine bakın.

Kurulumu düzeltdikten sonra doğrulamak ve devam etmek için yeniden İleri'yi seçin. API kullanıcıları ayrıca atanan yönetilen kimlik ve API anahtarlarıyla kimlik doğrulamayı yapılandırabilir.

Mevcut Azure Blob Depolama bağlanmak ve kapsayıcılarınızda depolanan dosyaları kullanmak istiyorsanız veri kaynağı olarak Azure Blob Depolama kullanmak isteyebilirsiniz.

Otomatik dizin yenilemelerini zamanlama

Not

Otomatik dizin yenileme yalnızca Azure Blob Depolama için desteklenir.

Azure AI Search dizininizi en son verilerinizle güncel tutmak için, verileriniz her güncelleştirildiğinde el ile güncelleştirmek yerine otomatik bir dizin yenilemesi zamanlayabilirsiniz. Otomatik dizin yenileme yalnızca veri kaynağı olarak Azure Blob Depolama seçtiğinizde kullanılabilir. Otomatik dizin yenilemesini etkinleştirmek için:

Azure AI Foundry portalını kullanarak veri kaynağı ekleyin.
Veri kaynağı seçin veya ekleyin altında Dizin oluşturucu zamanlaması'nı seçin ve uygulamak istediğiniz yenileme temposunu seçin.

Veri alımı bir kezden farklı bir tempoya ayarlandıktan sonra Azure AI Search dizin oluşturucuları ile eşdeğer 0.5 * the cadence specifiedbir zamanlama oluşturulur. Bu, belirtilen tempoda dizin oluşturucuların depolama kapsayıcısından eklenen veya değiştirilen belgeleri çekmesi, yeniden işlemesi ve dizine eklemesi anlamına gelir. Bu işlem, güncelleştirilmiş verilerin otomatik olarak istenen tempoda son dizinde önceden işlenmesini ve dizinlenmesini sağlar. Verilerinizi güncelleştirmek için yalnızca Azure portalından ek belgeleri karşıya yüklemeniz gerekir. Portaldan Depolama Hesabı>Kapsayıcıları'nı seçin. Özgün kapsayıcının adını ve ardından Karşıya Yükle'yi seçin. Dizin, zamanlanan yenileme döneminden sonra dosyaları otomatik olarak alır. Azure AI Search kaynağında oluşturulan ara varlıklar, gelecekteki çalıştırmalara izin vermek için alımdan sonra temizlenmez. Bu varlıklar şunlardır:

{Index Name}-index
{Index Name}-indexer
{Index Name}-datasource
{Index Name}-skillset

Zamanlamayı değiştirmek için Azure portalını kullanabilirsiniz.

Arama kaynağı sayfanızı Azure portalında açma
Sol bölmeden Dizin Oluşturucular'ı seçin
Dizin adınızı ön ek olarak içeren iki dizin oluşturucuda aşağıdaki adımları gerçekleştirin.
1. Açmak için dizin oluşturucuyu seçin. Ardından ayarlar sekmesini seçin.
2. Zamanlamayı "Zamanlama" ile istediğiniz tempoya güncelleştirin veya "Aralık (dakika)" arasından özel bir tempo belirtin
3. Kaydet'i seçin.

Veriler Azure AI aramasına nasıl alınır?

{job-id}-index
{job-id}-indexer, saatlik veya günlük bir zamanlama belirtilirse, aksi takdirde, dizin oluşturucu alma işleminin sonunda temizlenir.
{job-id}-datasource

Bu işlev artık doğal olarak Azure AI Search tarafından yönetildiğinden öbekler kapsayıcısı artık kullanılamaz.

Veri bağlantısı

Azure AI Foundry portalını kullanarak makinenizden dosyaları karşıya yükleyerek Verilerinizde Azure OpenAI'yi deneyebilirsiniz. Ayrıca yeni bir Azure Blob Depolama hesabı ve Azure AI Search kaynağı oluşturma seçeneğiniz de vardır. Hizmet daha sonra dosyaları bir Azure depolama kapsayıcısına depolar ve kapsayıcıdan alım gerçekleştirir. Bu veri kaynağı seçeneğini kullanmayı öğrenmek için hızlı başlangıç makalesini kullanabilirsiniz.

Veriler Azure AI aramasına nasıl alınır?

{job-id}-index
{job-id}-indexer, saatlik veya günlük bir zamanlama belirtilirse, aksi takdirde, dizin oluşturucu alma işleminin sonunda temizlenir.
{job-id}-datasource

Bu işlev artık doğal olarak Azure AI Search tarafından yönetildiğinden öbekler kapsayıcısı artık kullanılamaz.

Veri bağlantısı

URL'leri yapıştırabilirsiniz; hizmet, web sayfası içeriğini modelden yanıt oluştururken kullanarak depolar. Kullandığınız URL'lerdeki/web adreslerindeki içeriğin düzgün bir şekilde alınması için aşağıdaki özelliklere sahip olması gerekir:

Verilerinizi Azure OpenAI Hizmeti ile kullanma gibi genel bir web sitesi - Azure OpenAI | Microsoft Learn. Erişim denetimine sahip bir URL/Web adresi ekleyemezsiniz, örneğin parolalı adresler.
HTTPS web sitesi.
Her URL'deki içeriğin boyutu 5 MB'tan küçüktür.
Web sitesi desteklenen dosya türlerinden biri olarak indirilebilir.
Yalnızca bir iç içe bağlantı katmanı desteklenir. Web sayfasında en fazla 20 bağlantı getirilir.

Veri alımı için URL/web adresini ekledikten sonra, URL'nizdeki web sayfaları getirilir ve kapsayıcı adıyla Azure Blob Depolama kaydedilir: webpage-<index name>. Her URL, hesaptaki farklı bir kapsayıcıya kaydedilir. Ardından dosyalar, modelle sohbet ederken almak için kullanılan bir Azure AI Search dizininde dizinlenir.

Veriler Azure AI aramasına nasıl alınır?

{job-id}-index
{job-id}-indexer, saatlik veya günlük bir zamanlama belirtilirse, aksi takdirde, dizin oluşturucu alma işleminin sonunda temizlenir.
{job-id}-datasource

Bu işlev artık doğal olarak Azure AI Search tarafından yönetildiğinden öbekler kapsayıcısı artık kullanılamaz.

Veri bağlantısı

Elasticsearch vektör veritabanınıza bağlanabilir ve verilerinizle sohbet edebilirsiniz.

Önkoşullar

Elasticsearch veritabanı
Ekleme modeli. Şunları yapabilirsiniz:
- Mevcut bir Azure OpenAI text-embedding-ada-002 ekleme modelini kullanma veya
- Elasticsearch'te barındırılan kendi ekleme modelinizi getirin.
GitHub'da bulunan python not defterini kullanarak verilerinizi hazırlayın.

Erişim isteğinde bulunma

Elasticsearch veri kaynağının kullanılması, Azure AI hizmetleri için hizmete özgü terimlerde Sınırlı Erişim Hizmeti koşullarına tabi olan bir önizleme özelliğidir. Elasticsearch veri kaynağına erişim istemek için bir istek formu doldurmanız ve göndermeniz gerekir. Form, şirketiniz ve Elasticsearch veri kaynağını kullanmayı planladığınız senaryo hakkında bilgi istemektedir. Formu gönderdikten sonra, Azure AI hizmetleri ekibi formu inceler ve 10 iş günü içinde size bir karar e-posta ile gönderir.

Verilerinizde Elasticsearch'i Azure OpenAI'ye bağlama

Elasticsearch'i ayarlayın ve bağlantı bilgilerinizi alın.

Elasticsearch veritabanınıza bağlanmak için Elasticsearch uç noktanızı ve kodlanmış API anahtarınızı girmeniz gerekir. Ardından bağlantıyı doğrula'ya tıklayın.
Bağlanmak istediğiniz dizini seçin.
(isteğe bağlı) özel alan eşlemesi kullanın.

Soruları yanıtlarken eşlenecek alanları tanımlamak için veri kaynağınızı eklediğinizde alan eşlemesini özelleştirebilir veya varsayılan değerleri kullanabilirsiniz.
Arama türünü seçin. Verilerinizde Azure OpenAI, veri kaynağınızı eklerken kullanabileceğiniz aşağıdaki arama türlerini sağlar.
Görüntülenen ekranlarda devam edin ve Kaydet ve kapat'ı seçin.

Arama türleri

Verilerinizde Azure OpenAI, veri kaynağınızı eklerken kullanabileceğiniz aşağıdaki arama türlerini sağlar.

Vektör aramasını etkinleştirmek için Azure OpenAI kaynağınıza dağıtılmış veya Elasticsearch'te barındırılan mevcut bir ekleme modeline sahip olmanız gerekir. Verilerinizi bağlarken ekleme dağıtımınızı seçin ve ardından Veri yönetimi altındaki vektör arama türlerinden birini seçin.

Arama seçeneği	Alma türü	Ek fiyatlandırma mı?	Sosyal haklar
anahtar sözcük	Anahtar sözcük araması	Ek fiyatlandırma yok.	İşleçlerle veya işleçler olmadan desteklenen herhangi bir dilde terimleri veya tümcecikleri kullanarak aranabilir alanlar üzerinde hızlı ve esnek sorgu ayrıştırma ve eşleştirme gerçekleştirir.
vektör	Vektör araması	Ekleme modelini çağırmak için Azure OpenAI hesabınızda ek fiyatlandırma .	İçeriğin vektör eklemelerine göre belirli bir sorgu girişine benzer belgeleri bulmanıza olanak tanır.

Dizin alanı eşlemesi

Soru yanıtlarken eşlenecek alanları tanımlamak için veri kaynağınızı eklerken alan eşlemesini özelleştirebilirsiniz. Alan eşlemesini özelleştirmek için veri kaynağınızı eklerken Veri Kaynağı sayfasında Özel alan eşlemesini kullan'ı seçin. İçerik verileri için birden çok alan sağlayabilirsiniz ve kullanım örneğiniz ile ilgili metin içeren tüm alanları içermelidir.

Bu alanların doğru bir şekilde eşleştirilmesi, modelin daha iyi yanıt ve alıntı kalitesine sahip olmasını sağlamaya yardımcı olur. Bunu ayrıca parametresini fields_mapping kullanarak API'de yapılandırabilirsiniz.

Elasticsearch'i API aracılığıyla veri kaynağı olarak kullanma

Azure AI Foundry portalında Elasticsearch veritabanlarını kullanmanın yanı sıra API'yi kullanarak Elasticsearch veritabanınızı da kullanabilirsiniz.

Çıkarım için MongoDB Atlas vektör dizininizi Verilerinizde Azure OpenAI ile bağlayabilirsiniz. Bunu Azure AI Foundry portalı, API ve SDK aracılığıyla kullanabilirsiniz.

Önkoşullar

MongoDB Atlas hesabı
Azure OpenAI ada002 ekleme modeli
- İyi bir alma kalitesi elde etmek için vektör dizininizin Azure OpenAI ada002 ekleme modeliyle oluşturulduğuna emin olun.

MongoDB Atlas için aşağıdaki modellerden birini kullanmanızı öneririz

gpt-4 (0613)
gpt-4 (turbo-2024-04-09)
gpt-4o (2024-05-13)
gpt-35-turbo (1106)

Yapılandırma

Yalnızca genel ağ erişimi desteklenir. Veritabanının genel erişime izin verdiğinden emin olun Mongo DB için ağ erişim ekranını gösteren ekran görüntüsü.

Veri hazırlama

Belgelerinizle yeni bir vektör arama dizini oluşturmak istiyorsanız, verilerinizi Verilerinizde Azure OpenAI ile kullanıma hazırlamak için GitHub'daki kullanılabilir betiği kullanabilirsiniz.

MongoDB hesabına bağlantı

Veri kaynağınızı eklemek için öncelikle MongoDB Atlas'a bir bağlantı oluşturmanız gerekir. Bu bağlantı kimlik doğrulaması (kullanıcı adı ve parola) gibi bilgileri içerir. MongoDB Atlas bağlantı dizesi uç noktasını aşağıdaki biçimi kullanarak girin: mongodb+srv://{user_name}:{password}@{endpoint}/?appName={application_name}. bağlantı dizesi yöntemleri hakkında daha fazla bilgi için MongoDB belgelerine bakın.

Kaynak dizini

Bir bağlantı oluşturduktan veya var olan bir bağlantıyı seçtikten sonra, bu bağlı hesaptaki belirli bir vektör dizinine bağlanmak için bilgileri girebilirsiniz. Veritabanınızın, koleksiyonunuzun ve vektör dizininizin adını girmeniz gerekir. Bağlantıyı başarıyla oluşturmak için bilgileri doğru girdiğinizden emin olun.

MongoDB Atlas'ı kullanmak için bir Azure OpenAI ada002 ekleme modeli gerekir. Bu model, henüz yoksa sizin için oluşturulur ve bu da hesabınızda kullanıma neden olur.

Dizin alanı eşlemesi

MongoDB Atlas veri kaynağınızı eklediğinizde, verilerinizi almak üzere düzgün bir şekilde eşlemek için veri alanları belirtebilirsiniz.

İçerik verileri (gerekli): Bu, her belgenin ana metin içeriğidir. Birden çok alan için değerleri boşluk olmadan virgülle ayırın.
Vektör alanı (gerekli): MongoDB Atlas arama dizininizde vektörleri içeren alan adı.
Dosya adı/başlık/URL: Sohbette bir belgeye başvurulduğunda daha fazla bilgi görüntülemek için kullanılır.

Bir yardımcı pilota (önizleme), Teams uygulamasına (önizleme) veya web uygulamasına dağıtma

Azure OpenAI'yi verilerinize bağladıktan sonra Azure AI Foundry portalındaki Dağıtılacak yer düğmesini kullanarak dağıtabilirsiniz.

Bu, çözümünüzü dağıtmak için birden çok seçenek sunar.

Microsoft Teams, web siteleri, Dynamics 365 ve diğer Azure Bot Hizmeti kanalları gibi çeşitli kanallara konuşma deneyimleri getirmenizi sağlayan Copilot Studio'daki bir yardımcı pilota (önizleme) doğrudan Azure AI Foundry portalından dağıtım yapabilirsiniz. Azure OpenAI hizmetinde ve Copilot Studio'da (önizleme) kullanılan kiracı aynı olmalıdır. Daha fazla bilgi için bkz . Verilerinizde Azure OpenAI bağlantısını kullanma.

Not

Copilot Studio'da bir copilot'a dağıtma (önizleme) yalnızca ABD bölgelerinde kullanılabilir.

Teams uygulaması, operasyonel verimliliği artırmak ve bilgilere erişimi demokratikleştirmek için Teams'de kullanıcılarınıza konuşma deneyimi getirmenizi sağlar. Bu Teams uygulaması, Azure hesabı kiracınız ve kişisel sohbet (grup dışı sohbet) senaryolarınızdaki kullanıcılara yapılandırılır.

Önkoşullar

Visual Studio Code'un en son sürümü yüklü.
Teams Araç Seti'nin en son sürümü yüklü. Bu, uygulamanız için proje iskelesi oluşturan bir VS Code uzantısıdır.
Node.js (sürüm 16 veya 18) yüklü. Daha fazla bilgi için bkz . proje türü için Node.js sürüm uyumluluk tablosu.
Microsoft Teams yüklü.
Microsoft 365 geliştirici hesabınızda oturum açın (test hesabı almak için bu bağlantıyı kullanarak: Geliştirici programı).
- Özel Teams uygulamalarını etkinleştirme ve hesabınızda özel uygulama yükleme özelliğini açma (buradaki yönergeler)
Azure komut satırı arabirimi (CLI) yüklü. Bu, Azure'a bağlanmak ve Azure kaynaklarında yönetim komutlarını yürütmek için platformlar arası bir komut satırı aracıdır. Ortam değişkenlerini ayarlama hakkında daha fazla bilgi için Azure SDK belgelerine bakın.
Azure hesabınıza, kullandığınız Azure OpenAI kaynağının Bilişsel Hizmetler OpenAI kullanıcısı veya Bilişsel Hizmetler OpenAI Katkıda Bulunanı rolü atanmıştır ve hesabınız Azure OpenAI API çağrıları yapabilir. Daha fazla bilgi için azure portalda bu rolü ayarlama yönergeleri için bkz . Azure OpenAI On Your data configuration ve Add role assignment to an Azure OpenAI resource .

Tek başına Teams uygulamasına doğrudan Azure AI Foundry portalından dağıtabilirsiniz. Aşağıdaki adımları izleyin:

Verilerinizi sohbet modeline ekledikten sonra Dağıt'ı ve ardından yeni bir Teams uygulaması (önizleme) seçin.
Teams uygulamanızın adını girin ve sonuçta elde edilen .zip dosyasını indirin.
.zip dosyasını ayıklayın ve klasörü Visual Studio Code'da açın.
Veri bağlantısı adımında API anahtarını seçtiyseniz Azure AI Search anahtarınızı el ile kopyalayıp dosyaya src\prompts\chat\config.json yapıştırın. Azure AI Arama Anahtarınızı Azure Search Kaynak Anahtarı altında bulunan anahtarı içeren Kodu görüntüle düğmesini seçerek Azure AI Foundry portalı Playground'da bulabilirsiniz. Sistem tarafından atanan yönetilen kimlik'i seçtiyseniz bu adımı atlayabilirsiniz. Veri bağlantısı bölümünde farklı veri bağlantısı seçenekleri hakkında daha fazla bilgi edinin.
Visual Studio Code terminalini açın ve Bilişsel Hizmet OpenAI Kullanıcı rolü atadığınız hesabı seçerek Azure CLI'da oturum açın. az login Oturum açmak için terminaldeki komutunu kullanın.
Uygulamanızda hata ayıklamak için F5 tuşuna basın veya sol bölmeden Çalıştır ve Hata Ayıkla'yı seçin. Ardından açılan listeden hata ayıklama ortamınızı seçin. Özel yardımcı pilotunuzla sohbet edebileceğiniz bir web sayfası açılır.

Not

Alıntı deneyimi yalnızca Hata Ayıklama (Edge) veya Hata Ayıklama (Chrome) içinde kullanılabilir.
Yardımcı pilotunuzu test ettikten sonra, Visual Studio Code'un sol bölmesindeki Teams Araç Seti Uzantısı'nı seçerek Teams uygulamanızı sağlayabilir, dağıtabilir ve yayımlayabilirsiniz. Yaşam Döngüsü bölümünde ayrı sağlama, dağıtma ve yayımlama aşamalarını çalıştırın. Özel uygulamaları ve Azure Hesabınızı karşıya yükleme izniniz olan Microsoft 365 hesabınızda oturum açmanız istenebilir.
Uygulamanızı sağlama: (Bulut kaynaklarını sağlama bölümünde ayrıntılı yönergeler)
Özel yardımcı pilotunuzun dağıtılan Kullanıcı Tarafından Atanan Yönetilen Kimlik kaynağına Bilişsel Hizmet OpenAI Kullanıcı rolünü atayın.
1. Azure portalına gidin ve özel yardımcı pilotunuz için yeni oluşturulan Kullanıcı Tarafından Atanan Yönetilen Kimlik kaynağını seçin.
2. Azure Rol Atamaları'na gidin.
3. Rol ataması ekle'yi seçin. Aşağıdaki parametreleri belirtin:
  - Kapsam: kaynak grubu
  - Abonelik: Azure OpenAI kaynağınızın aboneliği
  - Azure OpenAI kaynağınızın kaynak grubu
  - Rol: Bilişsel Hizmet OpenAI kullanıcısı
Buluta dağıtma başlığındaki yönergeleri izleyerek uygulamanızı Azure'a dağıtın.
Teams uygulamasını yayımlama başlığındaki yönergeleri izleyerek uygulamanızı Teams'de yayımlayın.

Önemli

Teams uygulamanız, tek kiracılı kullanım için varsayılan olarak güvenli bir şekilde yapılandırıldığından kurulum sırasında kullanılan Azure hesabınızın aynı kiracısında kullanıma yöneliktir. Bu uygulamanın kurulum sırasında kullanılan Azure kiracısıyla ilişkilendirilmemiş bir Teams hesabıyla kullanılması hataya neden olur.

Teams uygulamanızdaki README dosyasında ek ayrıntılar ve ipuçları bulunur. Ayrıca kılavuzlu adımlar için bkz . Öğretici - Teams kullanarak Özel Copilot oluşturma.

Verilerinizde Azure OpenAI için erişimi ve ağı yapılandırma

Verilerinizde Azure OpenAI'yi kullanabilir ve Microsoft Entra ID rol tabanlı erişim denetimi, sanal ağlar ve özel uç noktalar ile verileri ve kaynakları koruyabilirsiniz. Azure AI Search güvenlik filtreleri ile farklı kullanıcılar için yanıtlarda kullanılabilecek belgeleri de kısıtlayabilirsiniz. Bkz . Verilerinizde Azure OpenAI erişimi ve ağ yapılandırması.

En iyi yöntemler

Model tarafından verilen yanıtların kalitesini artırmayı öğrenmek için aşağıdaki bölümleri kullanın.

Alma parametresi

Verileriniz Azure AI Search'e aktarıldığında, stüdyo veya alım API'sinde aşağıdaki ek ayarları değiştirebilirsiniz.

Öbek boyutu (önizleme)

Verilerinizde Azure OpenAI, belgelerinizi almadan önce öbeklere bölerek işler. Öbek boyutu, arama dizinindeki herhangi bir öbek için belirteç sayısı bakımından en büyük boyutdur. Öbek boyutu ve alınan belge sayısı, modele gönderilen istemde ne kadar bilgi (belirteç) olduğunu denetler. Genel olarak, alınan belge sayısıyla çarpılan öbek boyutu, modele gönderilen toplam belirteç sayısıdır.

Kullanım örneğiniz için öbek boyutunu ayarlama

Varsayılan öbek boyutu 1.024 belirteçtir. Ancak, verilerinizin benzersizliği göz önünde bulundurulduğunda farklı bir öbek boyutunu (256, 512 veya 1.536 belirteç gibi) daha etkili bulabilirsiniz.

Öbek boyutunu ayarlamak sohbet botunuzun performansını artırabilir. En uygun öbek boyutunu bulmak için deneme ve hata gerekirken veri kümenizin doğasını göz önünde bulundurarak işe başlayın. Daha küçük bir öbek boyutu genellikle doğrudan olgular ve daha az bağlam içeren veri kümeleri için daha iyidir, ancak daha büyük bir öbek boyutu daha bağlamsal bilgiler için yararlı olabilir, ancak alma performansını etkileyebilir.

256 gibi küçük bir öbek boyutu daha ayrıntılı öbekler üretir. Bu boyut, modelin çıkışını oluşturmak için daha az belirteç kullanacağı anlamına da gelir (alınan belge sayısı çok yüksek olmadığı sürece), potansiyel olarak daha düşük maliyetlidir. Daha küçük öbekler, modelin uzun metin bölümlerini işlemesi ve yorumlaması gerekmeyecek ve bu da gürültüyü ve dikkat dağınıklığını azaltacak şekilde anlamına gelir. Ancak bu ayrıntı düzeyi ve odak olası bir sorun oluşturur. Özellikle alınan belge sayısı 3 gibi düşük bir değere ayarlanmışsa önemli bilgiler en çok alınan öbekler arasında yer almayabilir.

İpucu

Öbek boyutunu değiştirmenin belgelerinizin yeniden alınmasını gerektirdiğini unutmayın, bu nedenle öncelikle katılık ve alınan belge sayısı gibi çalışma zamanı parametrelerini ayarlamanız yararlı olur. hala istenen sonuçları alamıyorsanız öbek boyutunu değiştirmeyi göz önünde bulundurun:

Belgelerinizde olması gereken yanıtlarla ilgili sorular için "Bilmiyorum" gibi çok sayıda yanıtla karşılaşıyorsanız ayrıntı düzeyini artırmak için öbek boyutunu 256 veya 512'ye düşürmeyi göz önünde bulundurun.
Sohbet botu bazı doğru ayrıntıları sağlıyorsa ancak alıntılarda belirgin hale gelen diğerlerini eksikse öbek boyutunu 1.536'ya yükseltmek daha bağlamsal bilgilerin yakalanmasına yardımcı olabilir.

Çalışma zamanı parametreleri

Azure AI Foundry portalının ve API'nin Veri parametreleri bölümünde aşağıdaki ek ayarları değiştirebilirsiniz. Bu parametreleri güncelleştirirken verilerinizi yeniden boyutlandırmanız gerekmez.

Parametre adı	Açıklama
Verilerinize yanıtları sınırlama	Bu bayrak, sohbet botunun veri kaynağıyla ilgisi olmayan sorguları işleme yaklaşımını veya tam bir yanıt için arama belgelerinin yetersiz olduğu durumlarda yapılandırılır. Bu ayar devre dışı bırakıldığında model, yanıtlarını belgelerinize ek olarak kendi bilgileriyle tamamlar. Bu ayar etkinleştirildiğinde, model yalnızca yanıtlar için belgelerinize güvenmeye çalışır. Bu, API'deki parametredir `inScope` ve varsayılan olarak true olarak ayarlanır.
Alınan belgeler	Bu parametre 3, 5, 10 veya 20 olarak ayarlanabilen bir tamsayıdır ve son yanıtı formüle etmek için büyük dil modeline sağlanan belge öbeklerinin sayısını denetler. Varsayılan olarak, bu değer 5 olarak ayarlanır. Arama işlemi gürültülü olabilir ve bazen öbekleme nedeniyle ilgili bilgiler arama dizinindeki birden çok öbeklere yayılabilir. 5 gibi bir top-K numarası seçmek, arama ve öbekleme sınırlamalarına rağmen modelin ilgili bilgileri ayıklayabilmesini sağlar. Ancak, sayıyı çok yüksek artırmak modelin dikkatini dağıtabilir. Ayrıca, etkili bir şekilde kullanılabilecek en fazla belge sayısı modelin sürümüne bağlıdır, her biri belgeleri işlemek için farklı bir bağlam boyutuna ve kapasiteye sahiptir. Yanıtların önemli bağlamı eksik olduğunu fark ederseniz bu parametreyi artırmayı deneyin. Bu, `topNDocuments` API'deki parametredir ve varsayılan olarak 5'tir.
Katılık	Sistemin, benzerlik puanlarına göre arama belgelerini filtrelemedeki kararlılığını belirler. Sistem, Azure Search veya diğer belge depolarını sorgular, ardından ChatGPT gibi büyük dil modellerine hangi belgelerin sağlandığına karar verir. Ilgisiz belgeleri filtrelemek, uçtan uca sohbet botunun performansını önemli ölçüde artırabilir. Bazı belgeler, modele iletmeden önce düşük benzerlik puanlarına sahipse ilk K sonuçlarının dışında tutulur. Bu, 1 ile 5 arasında bir tamsayı değeriyle denetleniyor. Bu değerin 1 olarak ayarlanması, sistemin kullanıcı sorgusuna yönelik arama benzerliğine göre belgeleri en az şekilde filtreleyeceği anlamına gelir. Buna karşılık, 5 ayarı sistemin belgeleri agresif bir şekilde filtreleyerek çok yüksek bir benzerlik eşiği uygulayacağını gösterir. Sohbet botunun ilgili bilgileri atladığını fark ederseniz, daha fazla belge eklemek için filtrenin katılığını (değeri 1'e yakın olarak ayarlayın) düşürebilirsiniz. Buna karşılık, ilgisiz belgeler yanıtların dikkatini dağıtıyorsa eşiği artırın (değeri 5'e yakın ayarlayın). Bu, API'deki parametredir `strictness` ve varsayılan olarak 3 olarak ayarlanır.

Alıntılanmamış başvurular

Veri kaynağından alınan ancak alıntıya dahil edilmeyen belgeler için modelin API yerine "TYPE":CONTENT döndürülmesi "TYPE":"UNCITED_REFERENCE" mümkündür. Bu hata ayıklama için yararlı olabilir ve yukarıda açıklanan katılık ve alınan belgeler çalışma zamanı parametrelerini değiştirerek bu davranışı denetleyebilirsiniz.

Sistem iletisi

Verilerinizde Azure OpenAI kullanırken modelin yanıtını yönlendirmek için bir sistem iletisi tanımlayabilirsiniz. Bu ileti, Yanıtlarınızı, Verilerinizde Azure OpenAI'nin kullandığı artırılmış oluşturma (RAG) düzenine göre özelleştirmenize olanak tanır. Sistem iletisi, deneyimi sağlamak için bir iç temel isteme ek olarak kullanılır. Bunu desteklemek için, modelin verilerinizi kullanarak soruları yanıtlayabilmesini sağlamak için sistem iletisini belirli sayıda belirteç sonrasında kesiyoruz. Varsayılan deneyimin üzerine ek davranış tanımlıyorsanız sistem isteminizin ayrıntılı olduğundan ve tam olarak beklenen özelleştirmeyi açıkladığınızdan emin olun.

Veri kümenizi eklemeyi seçtikten sonra Azure AI Foundry portalındaki Sistem iletisi bölümünü veya API'deki parametreyi role_information kullanabilirsiniz.

Olası kullanım desenleri

Rol tanımlama

Yardımcınızın olmasını istediğiniz bir rol tanımlayabilirsiniz. Örneğin, bir destek botu oluşturuyorsanız "Kullanıcıların yeni sorunları çözmesine yardımcı olan uzman bir olay destek yardımcısısınız" ekleyebilirsiniz .

Alınan veri türünü tanımlama

Ayrıca, sağladığınız verilerin doğasını yardımcıya da ekleyebilirsiniz.

"Finansal rapor", "akademik rapor" veya "olay raporu" gibi veri kümenizin konusunu veya kapsamını tanımlayın. Örneğin, teknik destek için "Alınan belgelerde benzer olaylardan gelen bilgileri kullanarak sorguları yanıtlayabilirsiniz" ekleyebilirsiniz .
Verileriniz belirli özelliklere sahipse bu ayrıntıları sistem iletisine ekleyebilirsiniz. Örneğin, belgeleriniz Japonca ise , "Japonca belgeleri alırsınız ve bunları Japonca dilinde dikkatlice okumalı ve Japonca yanıtlamalısınız" ekleyebilirsiniz .
Belgeleriniz finansal rapordaki tablolar gibi yapılandırılmış veriler içeriyorsa, bu olguyu sistem istemine de ekleyebilirsiniz. Örneğin, verilerinizde tablolar varsa "Size finansal sonuçlarla ilgili tablolar biçiminde veriler verilmiştir ve kullanıcı sorularını yanıtlamak için hesaplamalar yapmak için tabloyu satır satır okumanız gerekir" ekleyebilirsiniz .

Çıkış stilini tanımlama

Bir sistem iletisi tanımlayarak modelin çıkışını da değiştirebilirsiniz. Örneğin, yardımcı yanıtlarının Fransızca olduğundan emin olmak istiyorsanız, "Fransızca bilgi bulabilen kullanıcıların bilgi bulmasına yardımcı olan bir yapay zeka yardımcısısınız. Kullanıcı soruları İngilizce veya Fransızca olabilir. Lütfen alınan belgeleri dikkatlice okuyun ve Fransızca yanıtlayın. Tüm yanıtların Fransızca olduğundan emin olmak için lütfen belgelerdeki bilgileri Fransızcaya çevirin."

Kritik davranışı yeniden doğrulama

Verilerinizde Azure OpenAI, verilerinizi kullanarak kullanıcı sorgularını yanıtlamaya yönelik istemler biçiminde büyük bir dil modeline yönergeler göndererek çalışır. Uygulama için kritik öneme sahip belirli bir davranış varsa, doğruluğunu artırmak için sistem iletisinde davranışı yineleyebilirsiniz. Örneğin, modeli yalnızca belgelerden yanıt almaya yönlendirmek için şunları ekleyebilirsiniz: "Lütfen yalnızca alınan belgeleri kullanarak ve bilginizi kullanmadan yanıtlayın. Lütfen yanıtınızdaki her talebin belgelerini almak için alıntılar oluşturun. Kullanıcı sorusu alınan belgeler kullanılarak yanıtlanamıyorsa, lütfen belgelerin kullanıcı sorgularıyla neden ilgili olduğunu açıklayın. Her durumda, kendi bilginizi kullanarak cevap verme."

prompt Engineering püf noktaları

komut istemi mühendisliğinde çıkışı geliştirmek için deneyebileceğiniz birçok püf noktası vardır. Bunun bir örneği, "Kullanıcı sorgularını yanıtlamak için alınan belgelerdeki bilgiler hakkında adım adım düşünelim. Belgelerden kullanıcı sorgularına ilgili bilgileri adım adım ayıklayın ve ilgili belgelerden ayıklanan bilgilerden bir yanıt oluştur."

Not

Sistem iletisi, alınan belgelere göre GPT yardımcısı'nın bir kullanıcı sorusuna nasıl yanıt vereceğini değiştirmek için kullanılır. Alma işlemini etkilemez. Alma işlemiyle ilgili yönergeler sağlamak isterseniz, bunları sorulara dahil etmek daha iyidir. Sistem iletisi yalnızca rehberliktir. Model, nesnellik gibi belirli davranışlarla ve tartışmalı ifadelerden kaçındığından belirtilen her yönergeye uymayabilir. Sistem iletisi bu davranışlarla çelişirse beklenmeyen davranışlar oluşabilir.

Verilerinize yanıtları sınırlama

Bu seçenek modelin yalnızca verilerinizi kullanarak yanıt vermesini teşvik eder ve varsayılan olarak seçilidir. Bu seçeneğin seçimini kaldırırsanız, model yanıt vermek için iç bilgilerini daha önceden uygulayabilir. Kullanım örneğinize ve senaryonuza göre doğru seçimi belirleyin.

Modelle etkileşim kurma

Modelle sohbet ederken en iyi sonuçları elde etmek için aşağıdaki uygulamaları kullanın.

Konuşma geçmişi

Yeni bir konuşma başlatmadan (veya öncekilerle ilgili olmayan bir soru sormadan) önce sohbet geçmişini temizleyin.
Konuşma geçmişi modelin geçerli durumunu değiştirdiğinden, ilk konuşma dönüşü ile sonraki dönüşler arasında aynı soru için farklı yanıtlar alınması beklenebilir. Yanlış yanıtlar alırsanız kalite hatası olarak bildirin.

Model yanıtı

Belirli bir sorunun model yanıtını memnun değilseniz, modelin nasıl yanıt verdiğini görmek için soruyu daha belirgin veya daha genel hale getirmeye çalışın ve sorunuzu uygun şekilde yeniden düzenleyin.
Düşünce zinciri isteminin , modelin karmaşık sorular/görevler için istenen çıkışları üretmesini sağlamada etkili olduğu gösterilmiştir.

Soru uzunluğu

Uzun sorular sormaktan kaçının ve mümkünse bunları birden çok soruya bölün. GPT modellerinin kabul edebildiği belirteç sayısı sınırları vardır. Belirteç sınırları şu şekilde sayılır: kullanıcı sorusu, sistem iletisi, alınan arama belgeleri (öbekler), iç istemler, konuşma geçmişi (varsa) ve yanıt. Soru belirteç sınırını aşarsa kesilir.

Çok dilli destek

Şu anda Azure OpenAI On Your Data'da anahtar sözcük araması ve anlamsal arama sorguları dizindeki veriyle aynı dildedir. Örneğin, verileriniz Japonca ise giriş sorgularının da Japonca olması gerekir. Diller arası belge alma için, Vektör araması etkin olarak dizini oluşturmanızı öneririz.
Bilgi alma ve model yanıtının kalitesini artırmaya yardımcı olmak için şu diller için anlamsal aramayı etkinleştirmenizi öneririz: İngilizce, Fransızca, İspanyolca, Portekizce, İtalyanca, Almanya, Çince (Zh), Japonca, Korece, Rusça, Arapça
Modele verilerinizin başka bir dilde olduğunu bildirmek için bir sistem iletisi kullanmanızı öneririz. Örneğin:
*"*Kullanıcıların alınan Japonca belgelerden bilgi ayıklamasına yardımcı olmak için tasarlanmış bir yapay zeka yardımcısısınız. Yanıtı formüle etmeden önce lütfen Japonca belgeleri dikkatle inceleyin. Kullanıcının sorgusu Japonca olacaktır ve japonca olarak da yanıt vermelisiniz."
Birden çok dilde belgeleriniz varsa, her dil için yeni bir dizin oluşturmanızı ve bunları Azure OpenAI'ye ayrı olarak bağlamanızı öneririz.

Akış verileri

Parametresini kullanarak bir akış isteği göndererek verilerin api yanıtının stream tamamını beklemeden artımlı olarak gönderilmesini ve alınmasını sağlayabilirsiniz. Bu, özellikle büyük veya dinamik veriler için performansı ve kullanıcı deneyimini geliştirebilir.

{
    "stream": true,
    "dataSources": [
        {
            "type": "AzureCognitiveSearch",
            "parameters": {
                "endpoint": "'$AZURE_AI_SEARCH_ENDPOINT'",
                "key": "'$AZURE_AI_SEARCH_API_KEY'",
                "indexName": "'$AZURE_AI_SEARCH_INDEX'"
            }
        }
    ],
    "messages": [
        {
            "role": "user",
            "content": "What are the differences between Azure Machine Learning and Azure AI services?"
        }
    ]
}

Daha iyi sonuçlar için konuşma geçmişi

Bir modelle sohbet ettiğinizde, sohbet geçmişinin sağlanması modelin daha yüksek kaliteli sonuçlar döndürmesine yardımcı olur. Daha iyi yanıt kalitesi için YARDıMCı iletilerinin özelliğini API isteklerinize eklemeniz context gerekmez. Örnekler için API başvuru belgelerine bakın.

İşlev Çağrısı

Bazı Azure OpenAI modelleri, işlev çağrısını etkinleştirmek için araçlar ve tool_choice parametreleri tanımlamanızı sağlar. REST API/chat/completionsaracılığıyla işlev çağrılarını ayarlayabilirsiniz. hem hem de toolsveri kaynakları istekteyse aşağıdaki ilke uygulanır.

ise tool_choicenone, araçlar yoksayılır ve yanıtı oluşturmak için yalnızca veri kaynakları kullanılır.
Aksi takdirde, belirtilmezse veya nesne olarak auto belirtilmezsetool_choice, veri kaynakları yoksayılır ve yanıt, varsa seçili işlev adını ve bağımsız değişkenleri içerir. Model hiçbir işlevin seçilmeyeceğine karar verse bile, veri kaynakları yine de yoksayılır.

Yukarıdaki ilke gereksinimlerinizi karşılamıyorsa, lütfen diğer seçenekleri göz önünde bulundurun, örneğin: istem akışı veya Yardımcılar API'si.

Verilerinizde Azure OpenAI için belirteç kullanımı tahmini

Azure OpenAI On Your Data Retrieval Augmented Generation (RAG), kullanıcıların sağlanan verilere göre sorularına yanıt almasına olanak sağlamak için hem arama hizmetinden (Azure AI Search gibi) hem de oluşturmadan (Azure OpenAI modelleri) yararlanan bir hizmettir.

Bu RAG işlem hattının bir parçası olarak, üst düzey üç adım vardır:

Kullanıcı sorgusunu arama amaçları listesinde reforme edin. Bu, yönergeler, kullanıcı sorusu ve konuşma geçmişi içeren bir istemle modele çağrı yapılarak yapılır. Şimdi bunu bir amaç istemi olarak adlandıralım.
Her amaç için, arama hizmetinden birden çok belge öbeği alınır. Kullanıcı tarafından belirtilen katılık eşiğine göre ilgisiz öbekleri filtreledikten ve iç mantığa göre öbekleri yeniden dilimledikten/topladıktan sonra, kullanıcı tarafından belirtilen sayıda belge öbeği seçilir.
Bu belge öbekleri, kullanıcı sorusu, konuşma geçmişi, rol bilgileri ve yönergelerle birlikte son model yanıtını oluşturmak için modele gönderilir. Şimdi bunu oluşturma istemi olarak adlandıralım.

Toplamda modele yapılan iki çağrı vardır:

Amacı işlemek için: Amaç istemine yönelik belirteç tahmini, kullanıcı sorusu, konuşma geçmişi ve amaç oluşturma için modele gönderilen yönergeleri içerir.
Yanıtı oluşturmak için: Oluşturma istemi için belirteç tahmini, kullanıcı sorusu, konuşma geçmişi, alınan belge öbekleri listesi, rol bilgileri ve oluşturma için ona gönderilen yönergeleri içerir.

Model tarafından oluşturulan çıkış belirteçlerinin (hem amaçlar hem de yanıt) toplam belirteç tahmini için dikkate alınması gerekir. Aşağıdaki dört sütunun tümünün toplanması, yanıt oluşturmak için kullanılan ortalama toplam belirteçleri verir.

Model	Oluşturma istemi belirteci sayısı	Amaç istemi belirteci sayısı	Yanıt belirteci sayısı	Amaç belirteci sayısı
gpt-35-turbo-16k	4297	1366	111	25
gpt-4-0613	3997	1385	118	18
gpt-4-1106-preview	4538	811	Kategori 119	27
gpt-35-turbo-1106	4854	1372	110	26

Yukarıdaki sayılar, aşağıdakilerle bir veri kümesinin test edilmesine dayanır:

191 konuşmaları
250 soru
Soru başına 10 ortalama belirteç
Konuşma başına ortalama 4 konuşma dönüşü

Ve aşağıdaki parametreler.

Ayar	Value
Alınan belge sayısı	5
Katılık	3
Öbek boyutu	1024
Alınan verilere verilen yanıtlar sınırlansın mı?	True

Bu tahminler, yukarıdaki parametreler için ayarlanan değerlere göre değişir. Örneğin, alınan belge sayısı 10 ve katılık 1 olarak ayarlanırsa belirteç sayısı artacaktır. Döndürülen yanıtlar alınan verilerle sınırlı değilse modele daha az yönerge verilir ve belirteç sayısı azaltılır.

Tahminler, sorulan belgelerin ve soruların niteliğine de bağlıdır. Örneğin, sorular açık uçluysa yanıtlar büyük olasılıkla daha uzun olacaktır. Benzer şekilde, daha uzun bir sistem iletisi daha fazla belirteç kullanan daha uzun bir isteme katkıda bulunur ve konuşma geçmişi uzunsa, istem daha uzun olur.

Model	Sistem iletisi için en fazla belirteç sayısı
GPT-35-0301	400
GPT-35-0613-16K	1000
GPT-4-0613-8K	400
GPT-4-0613-32K	Kategori 2000
GPT-35-turbo-0125	Kategori 2000
GPT-4-turbo-0409	4000
GPT-4o	4000
GPT-4o-mini	4000

Yukarıdaki tabloda, sistem iletisi için kullanılabilecek en fazla belirteç sayısı gösterilmektedir. Model yanıtı için en fazla belirteçleri görmek için modeller makalesine bakın. Ayrıca, aşağıdakiler belirteçleri de tüketir:

Meta istemi: Modelden gelen yanıtları topraklama veri içeriğiyle (inScope=True API'de) sınırlarsanız en fazla belirteç sayısı daha yüksek olur. Aksi takdirde (örneğin, ) inScope=Falseüst sınır daha düşüktür. Bu sayı, kullanıcı sorusunun ve konuşma geçmişinin belirteç uzunluğuna bağlı olarak değişkendir. Bu tahmin, temel istem ve sorgu yeniden yazma istemlerini içerir.
Kullanıcı sorusu ve geçmişi: Değişken, ancak 2.000 belirteçle eşlendi.
Alınan belgeler (öbekler): Alınan belge öbekleri tarafından kullanılan belirteçlerin sayısı birden çok faktöre bağlıdır. Bunun üst sınırı, alınan belge öbeklerinin öbek boyutuyla çarpılmasıdır. Ancak, kalan alanlar sayıldıktan sonra kullanılan belirli model için kullanılabilir belirteçlere göre kesilir.

Kullanılabilir belirteçlerin %20'i model yanıtı için ayrılmıştır. Kullanılabilir belirteçlerin kalan %80'i meta istemini, kullanıcı sorusunu ve konuşma geçmişini ve sistem iletisini içerir. Kalan belirteç bütçesi, alınan belge öbekleri tarafından kullanılır.

Girişiniz tarafından kullanılan belirteç sayısını hesaplamak için (sorunuz, sistem iletisi/rol bilgileri gibi), aşağıdaki kod örneğini kullanın.

import tiktoken

class TokenEstimator(object):

    GPT2_TOKENIZER = tiktoken.get_encoding("gpt2")

    def estimate_tokens(self, text: str) -> int:
        return len(self.GPT2_TOKENIZER.encode(text))
      
token_output = TokenEstimator.estimate_tokens(input_text)

Sorun giderme

Başarısız işlemlerin sorunlarını gidermek için api yanıtında veya Azure AI Foundry portalında belirtilen hataları veya uyarıları her zaman göz önünde bulundurun. Yaygın hatalardan ve uyarılardan bazıları şunlardır:

Başarısız alma işleri

Kota Sınırlamaları Sorunları

Y hizmetinde X adına sahip bir dizin oluşturulamadı. Bu hizmet için dizin kotası aşıldı. Önce kullanılmayan dizinleri silmeniz, dizin oluşturma istekleri arasına bir gecikme eklemeniz veya hizmeti daha yüksek sınırlar için yükseltmeniz gerekir.

Bu hizmet için standart X dizin oluşturucu kotası aşıldı. Şu anda X standart dizin oluşturucularınız var. Önce kullanılmayan dizin oluşturucuları silmeniz, 'executionMode' dizin oluşturucusunu değiştirmeniz veya hizmeti daha yüksek sınırlar için yükseltmeniz gerekir.

Çözüm:

Daha yüksek bir fiyatlandırma katmanına yükseltin veya kullanılmayan varlıkları silin.

Önişleme Zaman Aşımı Sorunları

Web API isteği başarısız olduğundan beceri yürütülemedi

Web API beceri yanıtı geçersiz olduğundan beceri yürütülemedi

Çözüm:

Giriş belgelerini daha küçük belgelere bölün ve yeniden deneyin.

İzin Sorunları

Bu isteğin bu işlemi gerçekleştirme yetkisi yok

Çözüm:

Bu, depolama hesabına verilen kimlik bilgileriyle erişilebildiği anlamına gelir. Bu durumda, lütfen API'ye geçirilen depolama hesabı kimlik bilgilerini gözden geçirin ve depolama hesabının özel bir uç noktanın arkasına gizlenmediğini (bu kaynak için özel bir uç nokta yapılandırılmadıysa) emin olun.

Azure AI Search ile sorgu gönderirken 503 hatası

Her kullanıcı iletisi, tümü paralel olarak arama kaynağına gönderilen birden çok arama sorgusuna çevrilebilir. Bu, arama çoğaltmalarının ve bölümlerin sayısı düşük olduğunda azaltma davranışına neden olabilir. Tek bir bölümün ve tek bir çoğaltmanın destekleyebilecekleri saniye başına en fazla sorgu sayısı yeterli olmayabilir. Bu durumda, çoğaltmalarınızı ve bölümlerinizi artırmayı veya uygulamanıza uyku/yeniden deneme mantığı eklemeyi göz önünde bulundurun. Daha fazla bilgi için Azure AI Search belgelerine bakın.

Bölgesel kullanılabilirlik ve model desteği

Not

Aşağıdaki modeller Verilerinizde Azure OpenAI tarafından desteklenmez:

o1 modelleri
o3 modelleri

Bölge	`gpt-35-turbo-16k (0613)`	`gpt-35-turbo (1106)`	`gpt-4-32k (0613)`	`gpt-4 (1106-preview)`	`gpt-4 (0125-preview)`	`gpt-4 (0613)`	`gpt-4o`**	`gpt-4 (turbo-2024-04-09)`
Doğu Avustralya	✅	✅	✅	✅		✅
Doğu Kanada	✅	✅	✅	✅		✅
Doğu ABD	✅				✅		✅
Doğu ABD 2	✅			✅			✅	✅
Orta Fransa	✅	✅	✅	✅		✅
Doğu Japonya	✅
Orta Kuzey ABD	✅				✅		✅
Norveç Doğu	✅			✅
Orta Güney ABD					✅		✅
Güney Hindistan		✅		✅
Orta İsveç	✅	✅	✅	✅		✅		✅
Kuzey İsviçre	✅		✅			✅
Güney Birleşik Krallık	✅	✅		✅	✅
Batı ABD		✅		✅			✅

**Bu yalnızca metin uygulamasıdır

Azure OpenAI kaynağınız başka bir bölgedeyse Verilerinizde Azure OpenAI'yi kullanamazsınız.

Aracılığıyla paylaş

Verilerinizde Azure OpenAI

Verilerinizde Azure OpenAI nedir?

Verilerinizde Azure OpenAI ile geliştirme

Veri kaynakları eklemek için Azure Rol tabanlı erişim denetimleri (Azure RBAC)

Veri biçimleri ve dosya türleri

Desteklenen veri kaynakları

Arama türleri

Akıllı arama

Belge düzeyi erişim denetimi

Dizin alanı eşlemesi

Arama filtresi (API)

Veriler Azure AI aramasına nasıl alınır?

Veri bağlantısı

Bir yardımcı pilota (önizleme), Teams uygulamasına (önizleme) veya web uygulamasına dağıtma

Verilerinizde Azure OpenAI için erişimi ve ağı yapılandırma

En iyi yöntemler

Alma parametresi

Öbek boyutu (önizleme)

Kullanım örneğiniz için öbek boyutunu ayarlama

Çalışma zamanı parametreleri

Alıntılanmamış başvurular

Sistem iletisi

Olası kullanım desenleri

Verilerinize yanıtları sınırlama

Modelle etkileşim kurma

Akış verileri

Daha iyi sonuçlar için konuşma geçmişi

İşlev Çağrısı

Verilerinizde Azure OpenAI için belirteç kullanımı tahmini

Sorun giderme

Başarısız alma işleri

Azure AI Search ile sorgu gönderirken 503 hatası

Bölgesel kullanılabilirlik ve model desteği

Sonraki adımlar

Geri Bildirim

Ek kaynaklar