استخدام وحدات معالجة الرسومات بلا خادم في Azure Container Apps (معاينة)
توفر Azure Container Apps الوصول إلى وحدات معالجة الرسومات عند الطلب دون الحاجة إلى إدارة البنية الأساسية. كميزة بلا خادم، تدفع فقط مقابل وحدات معالجة الرسومات المستخدمة. عند التمكين، يرتفع عدد وحدات معالجة الرسومات المستخدمة لتطبيقك وينخفض لتلبية متطلبات التحميل للتطبيق الخاص بك. تمكنك وحدات معالجة الرسومات بلا خادم من تشغيل أحمال العمل بسلاسة باستخدام التحجيم التلقائي، والبدء البارد المحسن، والفوترة في الثانية مع تقليص الحجم إلى الصفر عند عدم الاستخدام، وتقليل الحمل التشغيلي.
وحدات معالجة الرسومات بلا خادم مدعومة فقط لملفات تعريف حمل عمل الاستهلاك. الميزة غير مدعومة لبيئات الاستهلاك فقط.
إشعار
لا يتوفر الوصول إلى وحدات معالجة الرسومات إلا بعد طلب حصص GPU. يمكنك إرسال طلب الحصة النسبية لوحدة معالجة الرسومات عبر حالة دعم العملاء.
المزايا
تعمل وحدات معالجة الرسومات بلا خادم على تسريع تطوير الذكاء الاصطناعي من خلال السماح لك بالتركيز على التعليمات البرمجية الأساسية الذكاء الاصطناعي وأقل على إدارة البنية الأساسية عند استخدام وحدات معالجة الرسومات. توفر هذه الميزة خيار الطبقة الوسطى بين واجهات برمجة التطبيقات بلا خادم لكتالوج نموذج Azure الذكاء الاصطناعي ونماذج الاستضافة على الحوسبة المدارة.
يوفر دعم وحدة معالجة الرسومات بلا خادم لتطبيقات الحاوية إدارة كاملة للبيانات حيث لا تترك بياناتك حدود الحاوية الخاصة بك مع توفير نظام أساسي مدار بلا خادم لإنشاء تطبيقاتك منه.
عند استخدام وحدات معالجة الرسومات بلا خادم في Container Apps، تحصل تطبيقاتك على:
وحدات معالجة الرسومات من الحجم إلى الصفر: دعم التحجيم التلقائي بلا خادم ل NVIDIA A100 وNVIDIA T4 GPUs.
الفوترة في الثانية: ادفع فقط مقابل حساب وحدة معالجة الرسومات الذي تستخدمه.
إدارة البيانات المضمنة: لا تترك بياناتك حدود الحاوية أبدا.
خيارات الحوسبة المرنة: يمكنك الاختيار بين أنواع NVIDIA A100 أو T4 GPU.
الطبقة الوسطى لتطوير الذكاء الاصطناعي: أحضر نموذجك الخاص على نظام أساسي للحوسبة المدارة بلا خادم.
السيناريوهات الشائعة
تصف السيناريوهات التالية، على الرغم من عدم شمولاها، حالات الاستخدام الشائعة لوحدات معالجة الرسومات بلا خادم.
الاستدلال في الوقت الحقيقي والدفعة: استخدام نماذج مخصصة مفتوحة المصدر مع أوقات بدء تشغيل سريعة وتحجيم تلقائي ونموذج فوترة في الثانية. وحدات معالجة الرسومات بلا خادم مثالية للتطبيقات الديناميكية. أنت تدفع فقط مقابل الحساب الذي تستخدمه، ويتم توسيع نطاق تطبيقاتك تلقائيا لتلبية الطلب.
سيناريوهات التعلم الآلي: تسريع التطبيقات التي تنفذ نماذج الذكاء الاصطناعي إنشاء مخصصة دقيقة، أو التعلم العميق، أو الشبكات العصبية، أو تحليل البيانات على نطاق واسع.
الحوسبة عالية الأداء (HPC): تستخدم التطبيقات التي تتطلب حسابات ومحاكاة معقدة، مثل الحوسبة العلمية أو النمذجة المالية أو التنبؤ بالطقس وحدات معالجة الرسومات كموارد للمطالب الحسابية العالية.
العرض والتصور: غالبا ما تستخدم التطبيقات التي تتضمن العرض ثلاثي الأبعاد أو معالجة الصور أو تحويل ترميز الفيديو وحدات معالجة الرسومات لتسريع عملية العرض وتمكين التصور في الوقت الفعلي.
تحليلات البيانات الضخمة: يمكن لوحدات معالجة الرسومات تسريع معالجة البيانات وتحليلها بين مجموعات البيانات الضخمة.
الاعتبارات
ضع في اعتبارك العناصر التالية أثناء استخدام وحدات معالجة الرسومات بلا خادم:
إصدار CUDA: تدعم وحدات GPUs بلا خادم أحدث إصدار CUDA
قيود الدعم:
- يمكن لحاوية واحدة فقط في التطبيق استخدام وحدة معالجة الرسومات في كل مرة. إذا كان لديك حاويات متعددة في أحد التطبيقات، فستحصل الحاوية الأولى على حق الوصول إلى وحدة معالجة الرسومات.
- يمكن لتطبيقات متعددة مشاركة نفس ملف تعريف حمل عمل GPU ولكن كل منها يتطلب النسخة المتماثلة الخاصة به.
- النسخ المتماثلة متعددة وكسرية لوحدة معالجة الرسومات غير مدعومة.
- الحاوية الأولى في التطبيق الخاص بك تحصل على حق الوصول إلى وحدة معالجة الرسومات.
عناوين IP: تستخدم وحدات معالجة الرسومات الاستهلاك عنوان IP واحدا لكل نسخة متماثلة عند إعداد التكامل مع شبكتك الظاهرية.
طلب الحصة النسبية لوحدة معالجة الرسومات بلا خادم
يتوفر الوصول إلى هذه الميزة فقط بعد أن يكون لديك حصة GPU بدون خادم. يمكنك إرسال طلب الحصة النسبية لوحدة معالجة الرسومات عبر حالة دعم العملاء. عند فتح حالة دعم لطلب الحصة النسبية لوحدة معالجة الرسومات، حدد نوع المشكلة "Technical".
إشعار
العملاء الذين لديهم اتفاقيات مؤسسة لديهم حصة T4 GPU واحدة ممكنة بشكل افتراضي.
المناطق المدعومة
تتوفر وحدات معالجة الرسومات بلا خادم في المعاينة في مناطق غرب الولايات المتحدة 3 وشرق أستراليا ووسط السويد.
استخدام وحدات معالجة الرسومات بلا خادم
عند إنشاء تطبيق حاوية من خلال مدخل Microsoft Azure، يمكنك إعداد الحاوية لاستخدام موارد GPU.
في علامة التبويب Container لعملية الإنشاء، قم بتعيين الإعدادات التالية:
ضمن قسم Container resource allocation ، حدد خانة الاختيار GPU .
بالنسبة إلى GPU Type*، حدد إما خيار NVIDIA A100 أو NVIDIA T4.
إدارة ملف تعريف حمل عمل GPU بلا خادم
يتم تشغيل وحدات معالجة الرسومات بلا خادم على ملفات تعريف حمل عمل وحدة معالجة الرسومات الاستهلاك. يمكنك إدارة ملف تعريف حمل عمل GPU للاستهلاك بنفس الطريقة مثل أي ملف تعريف حمل عمل آخر. يمكنك إدارة ملف تعريف حمل العمل الخاص بك باستخدام CLI أو مدخل Microsoft Azure.
تحسين البدء البارد لوحدة معالجة الرسومات
يمكنك تحسين البداية الباردة على الحاويات الممكنة لوحدة معالجة الرسومات عن طريق تمكين تدفق البيانات الاصطناعية على سجل حاويات Azure.
إشعار
لاستخدام تدفق البيانات الاصطناعية، يجب استضافة صور الحاوية في Azure Container Registry.
استخدم الخطوات التالية لتمكين تدفق الصور:
افتح Azure Container Registry في مدخل Microsoft Azure.
ابحث عن Repositories، وحدد Repositories.
حدد اسم المستودع الخاص بك.
من نافذة Repository، حدد Start artifact streaming.
حدد علامة الصورة التي تريد دفقها.
في النافذة المنبثقة، حدد Create streaming artifact.
إرسال الملاحظات
إرسال مشكلة إلى مستودع Azure Container Apps GitHub.