Mozaik AI Ağ Geçidi tanıtımı

Makale
03/06/2025

Önemli

Bu makalede desteklenen üretken yapay zeka modellerine ve uç noktalara hizmet veren ilişkili modellerine erişimi idare etmeye ve izlemeye yönelik Databricks çözümü olan Mozaik AI Ağ Geçidi açıklanmaktadır.

Mozaik AI Ağ Geçidi nedir?

Mozaik AI Ağ Geçidi, kuruluş içindeki üretken yapay zeka modellerinin ve aracılarının kullanımını ve yönetimini kolaylaştırmak için tasarlanmıştır. Hizmet sunan uç noktaları modellemek için idare, izleme ve üretime hazır olma durumunu getiren merkezi bir hizmettir. Ayrıca yapay zekanın kuruluşunuzda benimsenmesini demokratikleştirmek ve hızlandırmak için yapay zeka trafiğini çalıştırmanıza, güvenli hale getirmenize ve yönetmenize olanak tanır.

Tüm veriler, Unity Kataloğu'ndaki Delta tablolarına kaydedilir.

AI Gateway verilerinizden içgörüleri görselleştirmeye başlamak için GitHub'dan örnek AI Gateway panosunu indirin. Bu pano, kullanım izleme ve yük günlüğü çıkarım tablolarındaki verilerden yararlanıyor.

JSON dosyasını indirdikten sonra panoyu çalışma alanınıza aktarın. Panoları içeri aktarma yönergeleri için Pano dosyasını içeri aktarma bölümüne bakın.

Desteklenen özellikler

Aşağıdaki tablo, kullanılabilir AI Gateway özelliklerini ve uç nokta türlerini sunan modelin bunları desteklediğini tanımlar.

Özellik	Tanım	Harici model uç noktası	Foundation Model API'lerin tahsisli aktarım kapasitesi uç noktası	Mosaic Yapay Zeka ajanları
İzin ve hız sınırlama	Kimlerin erişimi olduğunu ve ne kadar erişime sahip olduğunu denetleme.	Destekleniyor	Destekleniyor	Desteklenmeyen
Yük günlüğü	çıkarım tablolarını kullanarak model API'lerine gönderilen verileri izleyin ve denetleyin.	Destekleniyor	Destekleniyor	Destekleniyor
Kullanımı izleme	sistem tablolarını kullanarak uç noktalarda operasyonel kullanımı ve ilişkili maliyetleri izleyin.	Destekleniyor	Destekleniyor	Desteklenmeyen
AI Korumaları	İsteklerde ve yanıtlarda istenmeyen verileri ve güvenli olmayan verileri önleyin. Bkz. AI Guardrails.	Destekleniyor	Destekleniyor	Desteklenmeyen
Fallbacks	Dağıtım sırasında ve sonrasındaki üretim kesintilerini en aza indirin.	Destekleniyor	Desteklenmeyen	Desteklenmeyen
Trafik ayırma	Modeller arasında trafiğin yükünü dengeleme.	Destekleniyor	Destekleniyor	Desteklenmeyen

Mozaik AI Ağ Geçidi, etkinleştirilmiş özellikler bazında ücretlendirilir. Önizleme sırasında bu ücretli özellikler arasında AI Guardrails, yük günlüğü ve kullanım izleme yer alır. Sorgu izinleri, hız sınırlama, geri dönüşler ve trafik bölme gibi özellikler ücretsizdir. Tüm yeni özellikler ücrete tabidir.

Aşağıdaki tablo, ücretli AI Gateway özellikleri için milyon (M) token başına Databricks birimleri (DBU) oranını yansıtır. Ücretler SKU altında Serverless Real-time Inference listelenir.

Özellik	DBU oranı
AI Korumaları	M belirteçleri başına 21,429 DBU
Yük günlüğü	M belirtkenleri başına 2.857 DBU
Kullanımı izleme	M belirteçleri başına 0,571 DBU

AI Korumaları

AI Guardrails, kullanıcıların hizmet uç noktasında veri uyumluluğunu yapılandırmalarına ve uygulamalarına ve temel model üzerinde yapılan isteklerde zararlı içeriği azaltmalarına olanak tanır. Hatalı istekler ve yanıtlar engellenir ve kullanıcıya varsayılan bir ileti döndürülür. Model sunma uç noktasında korumaları nasıl yapılandıracağınızı öğrenin.

Önemli

AI Guardrails moderasyon hizmeti, Temel Model API'lerine bağımlıdır ve belirteç başına ödeme modeli ile çalışır. Bu bağımlılık, AI Guardrails moderation hizmetinin kullanılabilirliğini, Foundation Model API'lerini destekleyen ve token başına ödeme modelini kullanan bölgelerle sınırlar.

Aşağıdaki tablo yapılandırılabilir koruyucu önlemleri özetler. Bkz. Sınırlamaları.

Koruyucu Bariyer	Tanım
Güvenlik filtreleme	Güvenlik filtrelemesi modelinizin şiddet içeren suç, kendine zarar verme ve nefret söylemi gibi güvenli olmayan ve zararlı içerikle etkileşim kurmasını önler. AI Gateway güvenlik filtresi Meta Llama 3 ile derlenir. Databricks, güvenlik filtresi olarak Llama Guard 2-8b kullanır. Llama Guard güvenlik filtresi ve güvenlik filtresi için hangi konuların geçerli olduğu hakkında daha fazla bilgi edinmek için Meta Llama Guard 2 8B model kartına bakın. Meta Llama 3, LLAMA 3 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. altında lisanslanır. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.
Kişisel olarak tanımlanabilir bilgiler (PII) algılama	Müşteriler kullanıcılar için adlar, adresler, kredi kartı numaraları gibi hassas bilgileri algılayabilir. Bu özellik için AI Gateway, Abd'de şu PII kategorilerini algılamak için Presidio kullanır: kredi kartı numaraları, e-posta adresleri, telefon numaraları, banka hesap numaraları ve sosyal güvenlik numaraları. PII sınıflandırıcısı, yapılandırılmış ve yapılandırılmamış verilerdeki hassas bilgileri veya PII'yi tanımlamaya yardımcı olabilir. Ancak, otomatik algılama mekanizmaları kullandığından, hizmetin tüm hassas bilgileri bulacağının garantisi yoktur. Sonuç olarak ek sistemler ve korumalar kullanılmalıdır. Bu sınıflandırma yöntemlerinin kapsamı öncelikli olarak ABD telefon numaraları ve sosyal güvenlik numaraları gibi ABD PII kategorilerine göre belirlenmiştir.
Konu yönetimi	İzin verilen bir konu kümesini listeleme özelliği. Sohbet isteği verildiğinde, bu koruma, sohbetin konusu izin verilen konularda değilse isteği işaretler.
Anahtar sözcük filtreleme	Müşteriler hem giriş hem de çıkış için farklı geçersiz anahtar sözcük kümeleri belirtebilir. Anahtar sözcük filtreleme için olası kullanım örneklerinden biri, modelin rakiplerden bahsetmemesidir. Bu koruma, anahtar sözcüğün istek veya yanıt içeriğinde var olup olmadığını belirlemek için anahtar sözcük veya dize eşleştirme kullanır.

AI Gateway'i kullan

Hizmet Sunma kullanıcı arabirimini kullanarak uç noktalara hizmet veren modelinizde AI Gateway özelliklerini yapılandırabilirsiniz. Bkz Model sunma uç noktalarında Yapay Zeka Ağ Geçidi'ni yapılandırma.

Sınırlamalar

Önizleme sırasındaki sınırlamalar şunlardır:

AI Gateway yalnızca şu amaçla desteklenir:
- Sağlanan aktarım hızı ile model sunma uç noktaları için Temel Model API'leri.
- Model sunucu uç noktaları dış modellere hizmet verir.
- Mozaik yapay zeka aracılarına hizmet veren uç noktaları sunan model.
Yapay zeka korumaları kullanıldığında, istek küme boyutu - eklemeler küme boyutu, tamamlamalar küme boyutu veya sohbet istekleri için n parametresi - 16'yı aşamaz.
Sağlanan aktarım hızı iş yükleri için, yalnızca hız sınırlaması yapılması ve AI Gateway özellikli çıkarım tablolarını kullanarak yük günlüğü kaydı desteklenir.
Bkz. AI Gateway özellikli çıkarım tablosu sınırlamaları.
işlevini çağırarak kullanır ve yapay zeka korumaları belirtirseniz, bu korumalar işlevin isteklerine ve ara yanıtlarına uygulanmaz. Ancak nihai çıktı yanıtına koruma önlemleri uygulanır.

Aracılığıyla paylaş