Azure'da yapay zeka iş yükleri için MLOps ve GenAIOps

Makale
11/19/2024

Yapay zeka iş yükü işlemleri, verilerin seçkisini ve bu verilerin tüketimini ortalar. operasyonlar, iş yükü için öncelik sırasına eklediğiniz kalite, güvenilirlik, güvenlik, etik ve diğer standartların elde edilmesinde ve korunmasında verimlilik sağlar.

İş yükü görevleri üç ana alana ayrılır: uygulama geliştirme, veri işleme ve yapay zeka modeli yönetimi. Her kategori DevOps, DataOps, MLOps ve GenAIOps gibi sektörde kanıtlanmış operasyonel yöntemleri benimsemelidir.

DevOps etkinlikleri, otomatik sürekli tümleştirme ve sürekli dağıtım (CI/CD) işlem hatları ve izleme aracılığıyla uygulama geliştirme yaşam döngüsü yönetiminin tamamını kapsar. Ancak yapay zeka iş yükleri için veri işlem hattı temel bileşenlerden biridir. DevOps'un uzmanlığı olan DataOps, veri ayıklama, dönüştürme ve yükleme (ETL/ELT) gibi işlemleri akışa alarak veri yaşam döngüsünü yönetmeye odaklanır. DataOps uygulayıcıları genellikle veri akışı performansını ve veri temizleme etkinliğini ölçer ve anomaliler için işlem hattını izler.

Yapay zeka iş yükleri doğal olarak belirsizdir. Birçok yapay zeka modeli, çıkarım sırasında aynı sorgu için farklı yanıtlar üretmeye eğilimli. Bu iş yükleri, yapay zeka çıkışlarını yönetebilen ve bu çıktıların öngörülemezliğine uyum sağlayabilecek süreçlere ihtiyaç duyar. DataOps, makine öğrenmesi iş akışlarını model eğitimi ve testi için kullanıma hazır hale getiren MLOps'a genişletir. MLOps'un özelleştirilmiş bir alt kümesi olan GenAIOps, üretken yapay zeka çözümlerini hedefler. Model bulma ve zenginleştirilmiş verilerle önceden eğitilmiş modelleri iyileştirme gibi görevleri içerir.

operasyonel etkinlikler genellikle örtüşür ve farklı yöntemler farklı dereceler için geçerlidir. Örneğin, ayrımcı yapay zekada DataOps önemli bir rol oynarken DevOps etkinlikleri daha az belirgindir. Buna karşılık, üretken yapay zekada operasyonel mükemmellik, DataOps'tan daha çok DevOps'a dayanır.

Ne olursa olsun, genel hedef geliştirme yaşam döngüsü boyunca verimli operasyonlarla yetenek teslimidir. Beklenen sonuçlar şunlardır:

Tutarlı sonuçlarla tekrarlanabilir işlemler.
Modellerin zaman içinde sürekli doğruluğu.
Riskleri en aza indiren etkili idare.
Model kaymaya uyum sağlamak için değişiklik yönetimi süreçleri.

Otomasyon ve izleme, bu hedeflere ulaşmak için önemli operasyonel stratejilerinizdir.

Ayrıca yapay zeka bileşenleri için rutin, planlanmamış ve acil durum operasyonları için standartlaştırılmış süreçler oluşturmanız ve uygun izleme mekanizmalarına sahip olmanız gerekir. Bu işlemler olmadan şunların riskiyle karşılaşırsınız:

Veri işleme, model barındırma, temel veri yönetimi ve diğer görevlerde yinelenen hatalar ve tekrarlanabilirlik.
Model eğitimi ve iyileştirmesi için kullanılan düşük kaliteli veya eski veriler.
Sistemdeki son kullanıcı güvenini etkileyen, en kötü durumda yasal, uyumluluk veya güvenlik sorunlarına yol açar.

Doğru araç kümesiyle yerleşik süreçler uygulamanız gerekir. Ortamlar arasında yapay zeka/ makine öğrenmesi iş akışlarını yönetmek için özel araçlar kullanılabilir.

Bu makale, işlemler için tasarım stratejisine odaklanır ve araç önerileri sağlar.

Öneriler

Bu makalede sağlanan önerilerin özeti aşağıda verilmiştir.

Öneri	Açıklama
Verimli bir iş yükü işlemleri yaşam döngüsü tasarlayın.	Yapay zeka iş yükünüzün bileşenlerine bağlı olarak farklı işlem aşamaları yaşam döngüsü için geçerli olacaktır. Senaryonuzla ilgili en iyi yöntemleri ve bunları uygulamak için kullanabileceğiniz araçları anlamanız önemlidir. İş yükünüzün tüm bileşenleri için temel önerileri öğrenmek ve uygulamak için zaman ayırın. ▪ DataOps ▪ MLOps ▪ GenAIOps ▪ Izleme
Her şeyi otomatikleştirin.	Otomasyon, bir iş yükünün yaşam döngüsünde tekrarlanabilirlik ve verimlilik sağlar. DevOps işlemleri bu konuda önemli bir katkıda bulunurken modellerinizi verimli bir şekilde derlemek, test etmek, doğrulamak ve dağıtmak için uygulamanız gereken ek adımlar vardır. ▪ Otomasyon
Mümkün olduğunda dağıtım işlem hatlarını kullanın.	Dağıtım işlem hatları, tekrarlanabilir altyapı dağıtımları sunmanıza veya kodu sürekli tümleştirmenize yardımcı olabilir. Ayrıca, modelleri üretime yükseltmeden önce oluşturmak ve/veya doğrulamak için de harika bir araçtır. Dağıtım işlem hatlarını uygulamak hem güvenilirliği hem de iş yükünüzün genel kullanıcı deneyimini geliştirmenize yardımcı olur. ▪ Dağıtım İşlem Hatları
Modellerinizde kaymayı ve çürümeyi önleyin.	Yeni model değişikliklerini denetimli bir şekilde kabul etmenize yardımcı olan yapılandırılmış bir işleme sahip olurken model bozulmasına ve kaymaya karşı korumanız gerekir. Model bakımıyla ilgili önerilere uyulması uyumlu kalmanıza, beklenmeyen kullanıcı deneyimlerinden kaçınmanıza ve daha güncel bir hizmet sunmanıza yardımcı olur. ▪ Model Bakımı

İş yükü işlemleri yaşam döngüsü

Bu görüntüde veri toplama, tutarsızlıkları veya hataları ortadan kaldırmak için verileri temizleme ve verileri çözümlenebilir bir biçime dönüştürme gibi yapay zeka modellerinin çalışma aşamaları gösterilmektedir. Bu aşamalar, hem ayrımcı modelleri hem de veri topraklama verilerini üretken modellerde eğitmeye yöneliktir. Ancak, bu görüntüde eğitim oluşturan modellerin belirli kullanım durumu açıklanmamıştır. Bu kullanım örneği bu makalenin kapsamı dışındadır.

MLOps ve GenAIOps'un aşamaları benzerdir. Ana fark, GenAIOps söz konusu olduğunda, odağın eğitimden doğru modeli seçmeye, istem mühendisliğine ve alan alanına özgü bilgileri eklemeye ve Alma Artırılmış Nesli (RAG) ince ayarlayarak veya uygulayarak kaydırmasıdır.

Dağıtım ve izleme aşamaları bile oldukça benzerdir.

Aşağıdaki bölümlerde yaygın işletimsel uygulamalar açıklanmaktadır. Ön üretimden üretime kadar yaşam döngüsünün her aşamasını kapsar.

DataOps

Veriler çeşitli üretim veri kaynaklarından toplanır ve ardından hataları ve tutarsızlıkları kaldırmak ve eksik değerleri işlemek için önceden işlenir. Son olarak, eğitim veya zenginleştirme için uygun bir biçime dönüştürülür ve normalleştirilir. Tasarımın yönleri Eğitim verileri ve Temel veri makalelerinde açıklanmıştır.

Birden çok kaynaktan ve karmaşık veri işlem hatlarından gelen büyük hacimli verileri işlemek zor olabileceğinden, bu aşamadaki veri işlemleri verimli olmalıdır. Bu aşamanın yüksek kaliteli veriler ürettiğinden emin olmak için, bu yaklaşımları kullanmanız gerekir. Kabul edilebilir kalite çubuğuna doğru ilerleme durumunu izlemek için bu aşamayı izleyin.

Verilerin üretim ortamından olduğu göz önünde bulundurularak verilerin güvenli olduğundan da emin olmanız gerekir. Güvenlik sorunlarını önlemeye yardımcı olmak için Geliştirme/Test gibi düşük ortamların üretim kadar güvenli olduğundan emin olun.

Not

İlk aşamalarda kapsamlı veri temizlemeye yatırım yaparak düşük kaliteli verileri ele alın. Yukarı akış işleme görevlerini gerçekleştirmek için madalyon, veri ağı ve özellik depoları gibi iyi bilinen analiz desenlerinden yararlanın. Yukarı akış aşamaları etkisizse, aşağı akış aşamaları sırasında kaliteyi artırmanız gerekir ve bu da her aşamada veri hazırlama gerçekleştiğinden iş yükü maliyetlerinin artmasına neden olur.

Veri işleme görevleri hakkında bilgi için şu makalelere bakın:

Araçlar

İş yükünüzün veri düzenleme araçlarını standartlaştırmanızı öneririz. Araçlar, etkinlikleri gruplandırabilen ve yerleşik otomasyona sahip bir veri işlem hattı sağlayabilmelidir.

Azure Data Factory işlem hattı ilk tercih olabilir. Birçok veri kaynağını verimli bir şekilde bağlayabilir ve işleyebilir. Ayrıca büyük veri ve veri ambarını birleştiren ve veri göllerini, Apache Spark'ı ve Azure Synapse SQL'i destekleyen Azure Synapse Analytics'i de göz önünde bulundurabilirsiniz. Ayrıca ETL için Data Factory ile tümleşir.

Eğitim verilerini hazırlamak için Azure Machine Learning işlem hatları, veri toplama ve işleme gibi görevleri otomatikleştirebilen özel özellikler sağlar.

Pandas (veri hazırlama için) ve Scrapy gibi açık kaynak teknolojiler popüler seçeneklerdir.

MLOps

Model eğitimi, modelin desenleri öğrenmesini ve tahminlerde bulunmasını sağlamak için uygun algoritmaları seçme ve bunlara önceden işlenmiş geçmiş verileri ve gözlemler sağlama işlemidir.

Modelin eğitimi (özellik mühendisliği) ve hiper parametre ayarlaması yinelemeli süreçlerdir ve pahalıdır. Her yineleme sırasında veri bilimcileri sonuçları veri, kod ve parametre birleşimleriyle izler. Doğru doğruluk düzeyi elde edilene kadar denemeleri el ile minimum çabayla izlemek için yinelenebilir işlem hatlarını kullanın.

Operasyonel bir diğer zorluk da denemelerin yapıldığı özel işlem kaynaklarını sağlamak ve ölçeklendirmektir. Ayrıca, modelleri verimli bir şekilde paketleyip yayımlamanız gerekir.

Ekipler, zorlukları azaltmak ve daha güvenli hale geldikçe kod tabanlı bir yaklaşıma geçiş yapmak için kullanıcı arabirimi tabanlı geliştirmeyle başlayabilir.

Araçlar

Kod sürümleri, ortamlar, parametreler, çalıştırmalar ve sonuçlar gibi ayrıntıları yakalayarak makine öğrenmesi denemelerini izleyebilen araçlar kullanmanızı öneririz. MLflow böyle bir açık kaynak çerçevedir. MLflow uyumlu olan ve veri bilim adamlarının projelerindeki üretkenliği ve yeniden üretilebilirliği yönetmesini sağlayan kolaylaştırılmış bir iş akışı sağlayan Azure Machine Learning çalışma alanlarını kullanmayı göz önünde bulundurun. Kaynak denetimi izleme ile kod geliştirmeyi yönetmek için makine öğrenmesi işlem hattını GitHub gibi kaynak denetimiyle tümleştirin veya dosya paylaşımlarını kullanın.

Barındırma işlem, iş akışı düzenleyicisi seçiminizi de etkileyebilir. Uygulamanız Azure Kubernetes Service'te (AKS) barındırılıyorsa Kubeflow kullanmayı göz önünde bulundurun.

Azure Machine Learning'i düşünüyorsanız, ürünün iş yükünün Iyi Tasarlanmış Çerçeve kalitesi konusunda size nasıl yardımcı olabileceğini anladığınızdan emin olmak için Machine Learning'de Azure İyi Tasarlanmış Çerçeve perspektifiyle başlamanızı öneririz.

Sürecin avantajının bir parçası, kişisel zamanı iyileştirmektir. Veri bilimciler genellikle keşif veri analizini (EDA) ve iş istasyonlarından denemeleri etkili bir şekilde yürütmek için belirli araçlara ve SDK'lara ihtiyaç duyar. Azure Machine Learning'de önceden oluşturulmuş seçeneklerin uygun olup olmadığını değerlendirin. Aksi takdirde, bu iş için iş istasyonu yapılandırmasını depolayın veya onaylı VM görüntülerini koruyun. Başlangıç noktası olarak kullanabileceğiniz bir görüntüye örnek olarak Veri Bilimi Sanal Makinesi (DSVM) gösterilebilir.

Bazı durumlarda, vm kullanımına ilke tarafından izin verilmiyor olabilir. Microsoft Dev Box ve Azure Sanal Masaüstü ekleme gibi alternatifleri arayın. Önceden oluşturulmuş görüntüler içeren makineleri önyüklemek için Docker kullanmayı da düşünebilirsiniz.

Ancak bu aşama büyüdükçe ve genişletilmiş denemelere ihtiyacınız olduğundan yönetilen işlem örneklerine geçin ve iş akışının bir parçası olarak tümleştirilmiş seçenekleri tercih edin. Geliştirme ve test amacıyla eğitim ve çıkarım için Azure Machine Learning işlem örneklerini kullanıp kullanamayacağınızı değerlendirin. İşlem kümeleri büyük veri kümelerini ve karmaşık modelleri işleyebilir.

Azure Machine Learning, SDK aracılığıyla hem kod tabanlı çözümler hem de otomatik makine öğrenmesi ve görsel tasarımcı gibi düşük kod seçenekleri sunar. Python SDK'sı, her birinin farklı özelliklere sahip olduğu modelleri eğitmek için birden fazla yol sunar. Machine Learning, eğitim sürecini hızlandırmak için ONNX Runtime Training'in ORTModule, DeepSpeed ve LoRA gibi gelişmiş iyileştirme ve dağıtılmış bilgi işlem teknolojilerini de destekler.

GenAIOps

Bu aşamadaki önemli etkinlikler, belirli bir kullanım örneği için önceden eğitilen modelleri tanımlamak üzere mevcut modelleri bulmak ve değerlendirmekle başlar. Bu yinelemeli bir işlemdir. Uygun bir model bulduktan sonra, yineleyici adımları da içeren ve belirli bir düzenleme düzeyi gerektiren etki alanına özgü topraklama için geliştirilmiş olmanın avantajı olabilir.

Modelleri tümleştirmek ve dağıtmak için modelleri, vektör dizinlerini, istemleri ve kod bloklarını düzenleme gibi geleneksel MLOps özelliklerinin ötesinde özel araçlar ve uygulamalar gerekir.

Araçlar

Bulma görevlerini ele almak için çeşitli sağlayıcılardan modelleri içeren model kataloglarından yararlanın. Azure AI Foundry portalındaki model kataloğu, seçilen koleksiyonlar arasından değerlendirme yapmanızı ve modelleri verimli bir şekilde dağıtmanızı sağlar.

Azure Machine Learning istem akışı düzenleme kodunun geliştirilmesine yardımcı olabilir ve prototip oluşturma, deneme, yineleme ve istem mühendisliğini etkinleştirir. Bu akışlar Azure Machine Learning yönetilen uç noktalarına dağıtılabilir. Mevcut CI/CD işlem hattı teknolojinizle akışları çalıştırıp dağıtamayacağınızı değerlendirin.

Dağıtım

Bu aşamada model bir barındırma ve çıkarım platformuna veya yapay zeka iş yüklerinin hizmet katmanına dağıtılır. API'lerin ölçeklenebilir bir kapsayıcı olarak paketlenmiş olması gerekir. Kapsayıcı platformu yönetilen bir işlem veya özel barındırma platformu olabilir. İşletimsel uygulamalar güvenli dağıtım sağlamalı ve geri almaları etkinleştirmelidir.

Benimsemeyi ve yönetimi basitleştirmek için hizmet olarak platform (PaaS) ve Azure OpenAI Hizmeti gibi sunucusuz çözümlerle başlayın. Uç nokta erişimini toplama için Azure Machine Learning Sunucusuz API'sini kullanmayı göz önünde bulundurun. Yönetilen işlem kümeleri, gelişmiş gereksinimler için uygun bir seçenektir. AKS'de kendi kendine barındırma başka bir seçenektir. İşleminizi doğru boyutlandırdığınızdan ve diğer iş yüklerinden uygun yalıtımı koruduğunuzdan emin olun. Modelinizi hizmet olarak altyapı (IaaS) olarak tam olarak barındırma gibi seçenekleri de göz önünde bulundurabilirsiniz. IaaS esneklik sağlar ancak operasyonel yük oluşturabilir. Bu seçenekler Uygulama platformunda açıklanmıştır.

Bu aşama, modeli üretime taşımadan önce sorunları yakalamak için son şansı sunar. Test işlemleri, modelin beklendiği gibi tahminler sağlayacak şekilde yapılandırıldığından emin olmak için doğrulama adımlarını içermelidir.

Aşamalı pozlama süreçlerini takip ederek ve yan yana dağıtımları kullanarak modeli mevcut üretim ortamıyla tümleştirmeniz gerekir. Kanarya modeli, yeni modelleri kullanıma sunmanın yaygın bir yoludur. Bu yöntemle kullanıcı tabanı aşamalı olarak artırılır. Mavi-yeşil dağıtım başka bir yöntemdir.

Araçlar

Modellerinizi çıkarım için dağıtmak için Azure Machine Learning işlem hatlarını veya Azure Pipelines'ı kullanabilirsiniz. Machine Learning, basitleştirilmiş işlemler için düğüm sağlama, işletim sistemi güncelleştirmeleri, otomatik ölçeklendirme, izleme ve yalıtılmış sanal ağlar gibi çeşitli özellikler sağlar.

Machine Learning, tek bir uç noktanın birden çok dağıtım içermesini sağlayan mavi-yeşil dağıtımı da destekler.

Azure Container Apps veya Azure Uygulaması Hizmeti gibi diğer barındırma platformlarını kullanıyorsanız, sağlama ve ölçeklendirme de dahil olmak üzere işlemden siz sorumlu olursunuz. Bu gibi durumlarda Azure DevOps, GitHub işlem hatlarını veya ci/CD teknolojisini tercih edebilirsiniz.

İzleme

İzleme önemli bir stratejidir ve tüm aşamalarda uygulanır. Devam eden bir süreçtir ve geliştirme yaşam döngüsü boyunca tutarlılığı ve güvenilirliği korumak için yapay zeka iş yüklerinin sıkı bir şekilde test edilmesini sağlayan kalite kapılarına giriş görevi görür. Modeller hem operasyonel hem de veri bilimi açısından izlenmelidir.

Kabul kalite çubuğuna yakınlığı ölçen ve anomalileri denetleen bir DataOps iç döngü izleme işlemine sahip olmanız önemle önerilir.

Önceden eğitilmiş modeller için, birincil olarak ilgililiğe odaklanarak veri kayma ve performansı izlemek de önemlidir. İlgili ve doğru olduklarından emin olmak için girişleri (istemleri) ve çıkışları (tamamlamalar) değerlendirin. Ayrıca, kötü amaçlı istemler aracılığıyla modelin davranışını işleme girişimleri gibi güvenlik risklerine de dikkat edin. Verileri her iki yönde de inceleyen ve uygunsuz içeriği filtreleyen kapsamlı bir çadır modu olduğundan emin olun. Bu konular ResponsibleAI tasarım alanında açıklanmıştır.

Dağıtımdan sonra, modelin bozulması gibi sorunları gidermek için izleme işlemleri gereklidir. Verilerdeki değişiklikler veya modelin ilgisiz sonuçlar üretmesine neden olabilecek dış değişiklikler nedeniyle modeller eskiebilir. Proaktif bir önlem olarak, sürekli izleme için otomatik işlemleri kullanın, doğruluk ve ilgi düzeyini korumak için değerlendirin ve yeniden eğitin. Ayrıca, en iyi performansı ve güvenilirliği sağlamaya yardımcı olmak için altyapı ve iş yükü ölçümlerini diğer tüm iş yüklerinde olduğu gibi izlemeniz gerekir. Daha fazla bilgi için bkz . Model bozulması için test etme.

Araçlar

Azure Machine Learning Veri toplayıcısı gibi çıkarım uç noktalarındaki ölçümleri toplamayı kolaylaştıran araçlara yatırım yapın.

Ayrıca, üretici yapay zeka için model performansı, veri kayabilirliği, güvenlik ve kalite gözlemlenebilirliğine de ihtiyacınız vardır.

Daha fazla bilgi için şu makalelere bakın:

Üretimdeki modellerden veri toplama
Azure Machine Learning ile model izleme
Azure AI Foundry portalında İçerik filtrelemesi

Otomasyon

Genel yaşam döngüsü birçok rol, sık yapılan değişiklikler ve birbiriyle ilişkili adımlar içerdiğinden yapay zeka iş yükleri karmaşıktır. El ile gerçekleştirilen işlemler hatalara ve tutarsızlıklara eğilimli olabilir. Veri işleme modeli barındırmada otomasyon, tekrarlanabilirlik ve verimlilik sağlamaya yardımcı olur. Otomasyon her zaman gerekli değildir, ancak bu karmaşıklıkları yönetmenin etkili bir yoludur. Otomasyonun riskleri azaltabileceği bazı kullanım örnekleri şunlardır:

Geleneksel kod dağıtımının aksine, yapay zeka/makine öğrenmesindeki belirsiz modeller ve çözümler yinelemeli deneme ve eğitim gerektirir. Birden çok ekip işbirliği yaparken, standartlaştırılmış işlemleri zorunlu tutmanın bir yolu olarak otomasyon, veri bilimciler, mühendisler ve operasyon ekipleri arasında tutarlılık, yeniden üretilebilirlik ve etkili işbirliği sağlamaya yardımcı olabilir.

Model yaşam döngüsü iki ana eğitim türü içerir:
- Çevrimiçi eğitim, kararların en son bilgilere dayandığından emin olmak için modele sık sık, bazen de günlük olarak yeni veriler ekler. Bu eğitim, modelin normal sürecin bir parçası olarak sürekli güncelleştirilmesi için iş yüküyle tümleştirilir.
- Çevrimdışı eğitim, modeli daha az sıklıkta eğiterek güncelleştirmeler arasında daha uzun bir boşluk sağlar. Eğitim işlemi ana iş yükünden ayrıdır ve zaman uyumsuz olarak gerçekleştirilir. Yeni model hazır olduktan sonra sisteme tümleştirilir.
Güncelleştirmeler seyrek olursa güvenilirlik tehlikeye girebilir. Bir güncelleştirme kaçırılırsa, önemli sorunlar olmadan ertelenebilir. Bu kavram topraklama verileri için de geçerlidir. Örneğin, RAG kullanıyorsanız, son verileri mi kullanmanız gerektiğine yoksa biraz daha eski verilerin mi yeterli olduğuna karar vermeniz gerekir. Her iki senaryo da güncel bilgi gereksinimini güncelleştirme sıklığının pratikliğiyle dengelemeyi içerir. Gereken sıklık ve güvenilirlik nedeniyle otomasyon aracılığıyla çevrimiçi eğitim gerçekleştirmeniz gerekir. Çevrimdışı eğitim için, gerekli sıklık nedeniyle maliyet avantajı analizi gerçekleştirerek otomasyonu gerekçelendirmeniz gerekir. Ayrıca, çevrimdışı donanım gibi daha ucuz kaynaklar kullanarak çevrimdışı eğitim gerçekleştirebilirsiniz.
Geleneksel DevOps işlemleri genellikle yapısal değişikliklerden etkilenir. Ancak yapay zeka ve makine öğrenmesinde modeller üretim verileri üzerinde eğitilir. Model bozulması önemli bir risk oluşturur ve izlenmezse zaman içinde performansın düşmesine neden olabilir. Model etkinliğini korumak için performans ölçümlerinin, uyarıların ve model yeniden eğitme işlemlerinin otomatik toplanması ve analizi gerekir. Belirli bir zamanda geçerli durumu net bir şekilde anlamak için veri ve model bağımlılıklarındaki değişiklikleri algılamanıza yardımcı olacak şekilde otomasyonu kullanın.
Modeller iki farklı yaklaşımla eğitilebilir.
- Modeller geliştirme ortamında tam üretim verileriyle eğitilir ve ortamlar aracılığıyla yalnızca yapıt yükseltilir. Bu yaklaşım işlem maliyetlerini düşürebilir ancak düşük ortamlardaki üretim verilerini işlemek için daha sıkı güvenlik gerektirir ve tüm kuruluşlarda mümkün olmayabilir.
- Model her ortamda eğitilir. Eğitim kodu daha düşük ortamlarda incelenip test edildiğinden, ancak işlem maliyetini artırdığından kod yükseltme kararlılığı konusunda yardımcı olabilir.
İki yaklaşımın da belirli avantajları ve dezavantajları vardır. Doğru yaklaşımı seçmek, kuruluşunuzun önceliklerine ve iş yükünün Yazılım Geliştirme Yaşam Döngüsü (SDLC) uygulamalarına bağlıdır. Yöntemi ne olursa olsun, üretim dağıtımından önce modelin kapsamlı bir şekilde test edilmesi ve değerlendirilmesi önemlidir
Otomasyon kodunuz , veri işleme aşamalarının net bir kaydını sağlayarak denetlenebilirliği desteklemek için veri kökenini içermelidir. Bu kayıt, beklentileri yönetmenize yardımcı olur ve sonuçlarla ilgili endişelerinizi giderebilmeniz için kararların nasıl alındığını göstermenizi sağlar.

Dağıtım işlem hatları

Yapay zeka /makine öğrenmesi iş yüklerinde model geliştirme, model oluşturma, doğrulama ve model barındırma platformlarına yükseltmeyi içerir. Veri işleme, özellik mühendisliği, model eğitimi veya geliştirme ile üretime dağıtım ile ilgili karmaşık iş akışlarını kolaylaştıran dağıtım işlem hatlarının olması önemlidir. İşlemleri donuk hale getiren yapay zekanın belirleyici olmayan yapısı göz önünde bulundurulduğunda, nitel testleri yayın işlem hatlarına ve izleme sistemlerine dahil etmeniz gerekir.

MLOps ve GenAIOps farklı yapay zeka etkinlikleri gerektirebilir ve temel teknolojiler farklı olabilir, ancak temel kavramlar DevOps'unkine benzer şekilde kalır. Mevcut DevOps işlemlerinizden en iyi yöntemleri uygulamanızı öneririz. Yapay zeka etkinliklerini iş yükünüzün mevcut işlem hatlarıyla tümleştirin.

Yapay zeka iş yükleri genellikle geleneksel kod dağıtımları içerir. Model dağıtımını kodla birlikte veya kendi yaşam döngüsünde ayrı ayrı işlemeyi seçebilirsiniz. Önceki yaklaşım tercih edilir. Yapay zeka işlemlerinin öncelikli olarak veri hazırlama, eğitim/ince ayar, veri yönetimi ve izlemeye odaklanmasını sağlamak için iş yükü dağıtımıyla modelleri ve çıkarım uç noktalarını paketlemeye hazır olun.

Aşağıdaki varlıkların üretim öncesi ve üretim aşamasına kadar MLOps ve GenAIOps yaşam döngüsünün tamamını kapsayacak şekilde nasıl uyarlanıp özelleştirilebileceğini yeniden değerlendirin:

Kod olarak altyapı (IaC) araçları
CI/CD işlem hatları
Sorunları izlemek ve tanımlamak için gözlemlenebilirlik yığını

Araçlar

Ci/CD için yaygın olarak kullanılan Azure Pipelines ve GitHub Actions iş akışlarını makine öğrenmesi modellerine genişletebilirsiniz. Makine öğrenmesi altyapısını, özel iş yükü bileşenlerini, düzenleme kodunu ve modelleri dağıtmaya yardımcı olur. Azure Machine Learning işlem hatlarını Azure DevOps veya GitHub işlem hatlarıyla birleştirin. Daha fazla bilgi için bkz . Azure Machine Learning ile Azure Pipelines'ı kullanma.

Doğru araç bileşimi seçiminizi etkileyen iki ana faktör vardır: kullanım örneği ve özellikler. Örneğin, Azure Machine Learning işlem hatları veri bilimciler tarafından gerçekleştirilen düzenleme için harikadır. Yeniden kullanımı, önbelleğe almayı ve daha fazlasını destekleyen zengin bir özellik kümesine sahiptir. Araç seçimleri için bkz. Hangi Azure işlem hattı teknolojisini kullanmalıyım?.

Model bakımı

Yapay zeka/ML ortamı, devam eden yeniliklerle rekabet içindedir. Yeni modeller sık sık ortaya çıkar, yeni kullanım örnekleri bulunur ve yeni veri kaynakları kullanılabilir hale gelir. Sonuç olarak model bozulması yaygın bir zorluk olarak karşı karşıyadır.

Model performansının zaman içindeki düşüşünü veya kaymasını önlemek için sürekli izleme, değerlendirme ve yeniden eğitme için otomatik süreçler uygulamanız gerekir. Örneğin:

Model kataloğunu koruma. Yeni modelleri bulma ve kataloğu güncelleştirme işlemini otomatikleştirin.
Yeni kullanım örneklerine uyum sağlayın. İş yükü gereksinimlerine yeni kullanım örnekleri eklendikçe sorguları tahmin edin ve veri işleme mantığınızı buna göre ayarlayın.
Yeni veri kaynaklarını birleştirme. Yeni veri kaynakları modelinizin tahmine dayalı gücünü veya ilgi düzeyini geliştirebiliyorsa, veri alımı işlem hattınızı bu kaynaklara bağlanacak ve bu kaynaklardan veri çekecek şekilde güncelleştirin.
Mevzuat gereksinimleriyle uyumluluğu değerlendirme. Yeni özelliklere uyum sağladığınızda, değişikliklerin kuruluş veya dış uyumluluk standartlarının kısıtlamaları dahilinde geçerli kaldığından emin olun.

Sürekli iyileştirmeyi izlemek için resmi bir süreç uygulayın ve kendi kendini geliştirmeyi bu döngü içinde bir alt işlem olarak birleştirin.

Sürekli evrim

Operasyonları düzenli olarak gözden geçirip geliştirin ve yenilikleri teşvik edin.

MLOps olgunluk modeli, el ile gerçekleştirilen işlemlerden tam otomasyona ilerler. El ile derlemeler ve izleme ile başlayın ve kapsamlı ölçümlerle gerekçelendirildiği şekilde otomatik uygulama derlemelerini, eğitim ortamlarını ve dağıtımı aşamalar halinde birleştirin. Daha fazla bilgi için bkz . MLOps olgunluk modeli.

GenAIOps olgunluk düzeyleri, otomatik iyileştirme tekniklerini kullanarak aşamalı olarak temel modellerden yapılandırılmış dağıtıma geçer. Daha fazla bilgi için bkz . GenAIOps için vade düzeyinizi ilerletme.

Sonraki adımlar

Tasarım alanı: İşlemler

Aracılığıyla paylaş

Azure'da yapay zeka iş yükleri için MLOps ve GenAIOps

Öneriler

İş yükü işlemleri yaşam döngüsü

DataOps

Araçlar

MLOps

Araçlar

GenAIOps

Araçlar

Dağıtım

Araçlar

İzleme

Araçlar

Otomasyon

Dağıtım işlem hatları

Araçlar

Model bakımı

Sürekli evrim

Sonraki adımlar

Geri Bildirim

Ek kaynaklar