Azure Kubernetes Service'te (AKS) makine öğrenmesi işlemleri (MLOps) en iyi yöntemleri
Bu makalede, AKS'de MLOps kullanılırken göz önünde bulundurulması gereken en iyi yöntemler ve dikkat edilmesi gereken noktalar açıklanmaktadır. MLOps hakkında daha fazla bilgi için bkz . Yapay zeka ve makine öğrenmesi iş akışları için makine öğrenmesi işlemleri (MLOps).
Kod olarak altyapı (IaC)
IaC , çeşitli uygulama türleri için tutarlı ve yeniden üretilebilir altyapı sağlama ve yönetimi sağlar. Akıllı uygulama dağıtımlarıyla, çıkarım, hizmet, eğitim ve ince ayar modelleri için gereken işlem gücü ve kaynaklar farklılık gösterebileceğinden IaC uygulamanız yapay zeka işlem hattı genelinde değişebilir. Yapay zeka geliştirici ekipleriniz için IaC şablonlarını tanımlama ve sürüm oluşturma, iş türleri arasında tutarlılık ve maliyet verimliliği sağlamaya yardımcı olurken, diğer yandan da kendi donanım gereksinimlerini ayrı ayrı tanımlayıp dağıtım sürecini hızlandırabilir.
Konteyner kullanımı
Kapsayıcı görüntülerinde model ağırlıklarınızı, meta verilerinizi ve yapılandırmalarınızı yönetmek taşınabilirlik, basitleştirilmiş sürüm oluşturma ve zaman içinde daha düşük depolama maliyetleri sağlar. Kapsayıcıya alma ile şunları yapabilirsiniz:
- Özellikle güvenli kapsayıcı kayıt defterlerinde depolanan, boyutu milyonlarca ila milyarlarca parametre arasında değişen büyük dil modelleri (LLM' ler) ve kararlı difüzyon modelleri için mevcut kapsayıcı görüntülerinden yararlanın.
- Tek bir büyük görüntüyü korumak yerine her görev için benzersiz bağımlılıkları içeren birden çok basit kapsayıcı kullanarak işlem hattınızda tek hata noktasından (SPOF) kaçının.
- Büyük metin/görüntü veri kümelerini temel kapsayıcı görüntünüzün dışında depolayın ve çalışma zamanında gerektiğinde bunlara başvurun.
Birkaç dakika içinde AKS'de yüksek performanslı bir LLM dağıtmak için Kubernetes AI Araç Zinciri operatörü ile çalışmaya başlayın.
Model yönetimi ve sürüm oluşturma
Model yönetimi ve sürüm oluşturma, modellerinizin zaman içindeki değişikliklerini izlemek için gereklidir. Modellerinizi sürüm ekleyerek şunları yapabilirsiniz:
- Farklı ortamlarda dağıtım kolaylığı için model kapsayıcılarınızda tutarlılığı koruyun.
- Model ağırlıklarının bir alt kümesinde daha hızlı yinelemek ve basit kapsayıcılarda yeni sürümleri korumak için parametre açısından verimli ince ayar (PEFT) yöntemleri kullanın.
Otomasyon
Otomasyon, el ile hataları azaltmanın, verimliliği artırmanın ve ML yaşam döngüsünde tutarlılık sağlamanın anahtarıdır. Görevleri otomatikleştirerek şunları yapabilirsiniz:
- Uygulamanıza yeni veri akışı yapılırken vektör alımı akışını otomatik olarak tetikleyen uyarı araçlarını tümleştirin.
- Düşüşleri izlemek ve yeniden eğitme işlem hatlarını tetiklemek için model performans eşiklerini ayarlayın.
Ölçeklenebilirlik ve kaynak yönetimi
Ölçeklenebilirlik ve kaynak yönetimi, yapay zeka işlem hattınızın uygulamanızın taleplerini karşılayabileceğinden emin olmak için kritik önem taşır. Kaynak kullanımınızı iyileştirerek şunları yapabilirsiniz:
- Dağıtılmış bilgi işlem ve birden çok paralellik düzeyi (örneğin, veri, model ve işlem hattı paralelliği) aracılığıyla ayrılmış CPU, GPU ve bellek kaynaklarınızı verimli bir şekilde kullanan araçları tümleştirin.
- Yoğun saatlerde yüksek model isteği hacimlerini desteklemek ve yoğun olmayan saatlerde ölçeği küçültmek için işlem kaynaklarınızda otomatik ölçeklendirmeyi etkinleştirin.
- Geleneksel uygulamalarınıza benzer şekilde AKS dayanıklılığı ve güvenilirlik en iyi yöntemlerini izleyerek olağanüstü durum kurtarmayı planlayın.
Güvenlik ve uyumluluk
Güvenlik ve uyumluluk, verilerinizi korumak ve yapay zeka işlem hattınızın mevzuat gereksinimlerini karşıladığından emin olmak için kritik öneme sahiptir. Güvenlik ve uyumluluk için en iyi yöntemleri uygulayarak şunları yapabilirsiniz:
- Açık kaynak model kapsayıcı görüntülerinde yaygın güvenlik açıklarını algılamak için ortak güvenlik açığı ve açığa çıkarma (CVE) taramasını tümleştirin.
- Azure Container Registry'nizde depolanan model kapsayıcı görüntüleri için Kapsayıcılar için Microsoft Defender kullanın.
- Kuruluş ilkelerinizle uyumlu kalmak için alınan verilerin, model değişikliklerinin ve ölçümlerin denetim kaydını koruyun.
Sonraki adımlar
AKS'de uygulama dağıtımınızın ve işlemlerinizin diğer alanlarındaki en iyi yöntemler hakkında bilgi edinin:
Azure Kubernetes Service