Aracılığıyla paylaş


Azure Kubernetes Service'te (AKS) makine öğrenmesi işlemleri (MLOps) en iyi yöntemleri

Bu makalede, AKS'de MLOps kullanılırken göz önünde bulundurulması gereken en iyi yöntemler ve dikkat edilmesi gereken noktalar açıklanmaktadır. MLOps hakkında daha fazla bilgi için bkz . Yapay zeka ve makine öğrenmesi iş akışları için makine öğrenmesi işlemleri (MLOps).

Kod olarak altyapı (IaC)

IaC , çeşitli uygulama türleri için tutarlı ve yeniden üretilebilir altyapı sağlama ve yönetimi sağlar. Akıllı uygulama dağıtımlarıyla, çıkarım, hizmet, eğitim ve ince ayar modelleri için gereken işlem gücü ve kaynaklar farklılık gösterebileceğinden IaC uygulamanız yapay zeka işlem hattı genelinde değişebilir. Yapay zeka geliştirici ekipleriniz için IaC şablonlarını tanımlama ve sürüm oluşturma, iş türleri arasında tutarlılık ve maliyet verimliliği sağlamaya yardımcı olurken, diğer yandan da kendi donanım gereksinimlerini ayrı ayrı tanımlayıp dağıtım sürecini hızlandırabilir.

Konteyner kullanımı

Kapsayıcı görüntülerinde model ağırlıklarınızı, meta verilerinizi ve yapılandırmalarınızı yönetmek taşınabilirlik, basitleştirilmiş sürüm oluşturma ve zaman içinde daha düşük depolama maliyetleri sağlar. Kapsayıcıya alma ile şunları yapabilirsiniz:

  • Özellikle güvenli kapsayıcı kayıt defterlerinde depolanan, boyutu milyonlarca ila milyarlarca parametre arasında değişen büyük dil modelleri (LLM' ler) ve kararlı difüzyon modelleri için mevcut kapsayıcı görüntülerinden yararlanın.
  • Tek bir büyük görüntüyü korumak yerine her görev için benzersiz bağımlılıkları içeren birden çok basit kapsayıcı kullanarak işlem hattınızda tek hata noktasından (SPOF) kaçının.
  • Büyük metin/görüntü veri kümelerini temel kapsayıcı görüntünüzün dışında depolayın ve çalışma zamanında gerektiğinde bunlara başvurun.

Birkaç dakika içinde AKS'de yüksek performanslı bir LLM dağıtmak için Kubernetes AI Araç Zinciri operatörü ile çalışmaya başlayın.

Model yönetimi ve sürüm oluşturma

Model yönetimi ve sürüm oluşturma, modellerinizin zaman içindeki değişikliklerini izlemek için gereklidir. Modellerinizi sürüm ekleyerek şunları yapabilirsiniz:

  • Farklı ortamlarda dağıtım kolaylığı için model kapsayıcılarınızda tutarlılığı koruyun.
  • Model ağırlıklarının bir alt kümesinde daha hızlı yinelemek ve basit kapsayıcılarda yeni sürümleri korumak için parametre açısından verimli ince ayar (PEFT) yöntemleri kullanın.

Otomasyon

Otomasyon, el ile hataları azaltmanın, verimliliği artırmanın ve ML yaşam döngüsünde tutarlılık sağlamanın anahtarıdır. Görevleri otomatikleştirerek şunları yapabilirsiniz:

  • Uygulamanıza yeni veri akışı yapılırken vektör alımı akışını otomatik olarak tetikleyen uyarı araçlarını tümleştirin.
  • Düşüşleri izlemek ve yeniden eğitme işlem hatlarını tetiklemek için model performans eşiklerini ayarlayın.

Ölçeklenebilirlik ve kaynak yönetimi

Ölçeklenebilirlik ve kaynak yönetimi, yapay zeka işlem hattınızın uygulamanızın taleplerini karşılayabileceğinden emin olmak için kritik önem taşır. Kaynak kullanımınızı iyileştirerek şunları yapabilirsiniz:

  • Dağıtılmış bilgi işlem ve birden çok paralellik düzeyi (örneğin, veri, model ve işlem hattı paralelliği) aracılığıyla ayrılmış CPU, GPU ve bellek kaynaklarınızı verimli bir şekilde kullanan araçları tümleştirin.
  • Yoğun saatlerde yüksek model isteği hacimlerini desteklemek ve yoğun olmayan saatlerde ölçeği küçültmek için işlem kaynaklarınızda otomatik ölçeklendirmeyi etkinleştirin.
  • Geleneksel uygulamalarınıza benzer şekilde AKS dayanıklılığı ve güvenilirlik en iyi yöntemlerini izleyerek olağanüstü durum kurtarmayı planlayın.

Güvenlik ve uyumluluk

Güvenlik ve uyumluluk, verilerinizi korumak ve yapay zeka işlem hattınızın mevzuat gereksinimlerini karşıladığından emin olmak için kritik öneme sahiptir. Güvenlik ve uyumluluk için en iyi yöntemleri uygulayarak şunları yapabilirsiniz:

Sonraki adımlar

AKS'de uygulama dağıtımınızın ve işlemlerinizin diğer alanlarındaki en iyi yöntemler hakkında bilgi edinin: