إعداد InfiniBand
تشير هذه المقالة إلى CentOS، وهو توزيع Linux يقترب من حالة نهاية العمر الافتراضي (EOL). يرجى مراعاة استخدامك والتخطيط وفقا لذلك. لمزيد من المعلومات، راجع إرشادات نهاية العمر الافتراضي CentOS.
ينطبق على: ✔️ أجهزة ظاهرية بنظام التشغيل Linux ✔️ أجهزة ظاهرية بنظام التشغيل Windows ✔️ مجموعات التوسعة المرنة ✔️ مجموعات التوسعة الموحدة
تلميح
جرب محدد الأجهزة الظاهرية للبحث عن الأحجام الأخرى الأكثر ملائمة لحمل عملك.
تشارك هذه المقالة بعض المعلومات حول المثيلات الممكنة ل RDMA لاستخدامها عبر شبكة InfiniBand (IB). تتميز بنية شبكة InfiniBand بتصميم كامل شجرة الدهون (وهو مخطط شبكة يوفر نطاقا تردديا عاليا وزمن انتقال منخفضا)، ما يضمن التماثل ثنائي الاتجاه وغير المحظور. يوفر هذا التكوين نطاقا تردديا متساويا بين أي جهازين ظاهريين (VMs) ضمن نفس مجموعة مقياس الجهاز الظاهري (VMSS).
مثيلات قادرة على RDMA
تتميز معظم أحجام الأجهزة الظاهرية HPC بواجهة شبكة للاتصال بالوصول المباشر إلى الذاكرة عن بُعد (RDMA). الأحجام المحددة من السلسلة N والمعينة بـ "r" هي أيضاً قادرة على RDMA. هذه الواجهة هي بالإضافة إلى واجهة شبكة Azure Ethernet القياسية المتوفرة في أحجام الأجهزة الظاهرية الأخرى.
تسمح هذه الواجهة الثانوية للمثيلات القادرة على RDMA بالاتصال عبر شبكة InfiniBand، وتعمل بمعدلات HDR لمعدلات HBv4 وHBv3 وHBv2 وEDR لمعدلات HB وHC وHX وNDv2 وFDR ل H16r وH16mr والأجهزة الظاهرية الأخرى المزودة بسلسلة N الممكنة ل RDMA. تستطيع إمكانات RDMA هذه تعزيز قابلية التوسع وأداء التطبيقات المستندة إلى واجهة تمرير الرسائل (MPI).
إشعار
دعم SR-IOV: في الحوسبة عالية الأداء من Azure، توجد حالياً فئتان من الأجهزة الظاهرية اعتماداً على ما إذا كانت SR-IOV ممكّنة لـ InfiniBand. في الوقت الحالي، يتم تمكين SR-IOV تقريباً لكل الجيل الأحدث من الأجهزة الظاهرية القادرة على RDMA أو التي تدعم InfiniBand على Azure باستثناء H16r وH16mr وNC24r. يتم تمكين RDMA فقط عبر شبكة InfiniBand ويتم دعمه لجميع الأجهزة الظاهرية التي تدعم RDMA. يتم دعم IP عبر IB فقط على الأجهزة الظاهرية التي تدعم SR-IOV. لم يتم تمكين RDMA عبر شبكة Ethernet.
نظام التشغيل - تستخدم توزيعات Linux مثل CentOS و RHEL و AlmaLinux و Ubuntu و SUSE بشكل شائع. يتم دعم Windows Server 2016 والإصدارات الأحدث على كافة الأجهزة الظاهرية من السلسلة HPC. لاحظ أن Windows Server 2012 R2 غير مدعوم على HBv2 فصاعداً كأحجام VM ذات أكثر من 64 نواة (افتراضية أو فعلية). راجع صور الجهاز الظاهري للحصول على قائمة بصور Linux VM المدعومة على Azure Marketplace وكيف يمكن تكوينها بشكل مناسب. تسرد صفحات حجم VM المعنية أيضاً دعم مكدس البرامج.
InfiniBand وبرامج التشغيل - على الأجهزة الظاهرية التي تدعم InfiniBand، يلزم توفر برامج التشغيل المناسبة لتمكين RDMA. راجع تمكين InfiniBand للتعرف على ملحقات الجهاز الظاهري أو التثبيت اليدوي لبرامج تشغيل InfiniBand.
MPI - تسمح أحجام VM التي تدعم SR-IOV على Azure باستخدام أي تطبيقات من MPI تقريباً مع Mellanox OFED. راجع إعداد MPI لـ HPC لمزيد من التفاصيل حول إعداد MPI على الأجهزة الظاهرية HPC على Azure.
إشعار
مساحة عنوان شبكة RDMA: تحتفظ شبكة RDMA في Azure بمساحة العنوان 172.16.0.0/16. لتشغيل تطبيقات MPI على مثيلات تم توزيعها في شبكة Azure الظاهرية، تأكد من أن مساحة عنوان الشبكة الظاهرية لا تتداخل مع شبكة RDMA.
خيارات تكوين الكتلة
يوفر Azure العديد من الخيارات لإنشاء مجموعات من الأجهزة الظاهرية HPC التي يمكنها الاتصال باستخدام شبكة RDMA، بما في ذلك:
الأجهزة الظاهرية - توزيع الأجهزة الظاهرية HPC القادرة على RDMA في نفس مجموعة المقياس أو مجموعة التوفر (عند استخدام نموذج توزيع Azure Resource Manager). إذا كنت تستخدم نموذج التوزيع الكلاسيكي، فقم بتوزيع الأجهزة الظاهرية في نفس الخدمة السحابية.
مجموعات مقياس الجهاز الظاهري - في مجموعة مقياس الجهاز الظاهري، تأكد من قصر التوزيع على مجموعة موضع واحدة لاتصال InfiniBand داخل مجموعة المقياس. على سبيل المثال، في قالب Resource Manager، قم بتعيين الخاصية
singlePlacementGroup
إلىtrue
.
لاحظ أن الحد الأقصى لحجم مجموعة المقياس التي يمكن تكوينها باستخدام singlePlacementGroup=true
محدد بـ 100 جهاز ظاهري بشكل افتراضي. إذا كانت احتياجات مجموعة توسيع وظائف HPC أعلى من 100 جهاز ظاهري في مستأجر واحد، فيمكنك طلب زيادة، وفتح طلب دعم عملاء عبر الإنترنت مجاناً. يمكن زيادة الحد الأقصى لعدد الأجهزة الظاهرية في مجموعة توسيع واحدة إلى 300. لاحظ أنه عند توزيع الأجهزة الظاهرية باستخدام "مجموعات التوفر"، يكون الحد الأقصى 200 جهاز ظاهري لكل مجموعة توفر.
أيضا، يعمل VMSS ك بحد عزل بين أحمال العمل داخل نفس المجموعة، ما يضمن بقاء المثيلات في VMSSs مختلفة معزولة عن بعضها البعض لضمان الأمان.
إشعار
MPI بين الأجهزة الظاهرية: إذا كان RDMA (على سبيل المثال، استخدام اتصال MPI) مطلوبا بين الأجهزة الظاهرية، فتأكد من أن الأجهزة الظاهرية موجودة في نفس مجموعة مقياس الجهاز الظاهري أو مجموعة التوفر.
Azure CycleCloud - إنشاء نظام مجموعة HPC باستخدام Azure CycleCloud لتشغيل وظائف MPI.
Azure Batch - إنشاء تجمع Azure Batch لتشغيل أحمال عمل MPI. لاستخدام مثيلات الحوسبة المكثفة عند تشغيل تطبيقات MPI مع Azure Batch، راجع استخدام مهام متعددة المثيلات لتشغيل تطبيقات واجهة تمرير الرسائل (MPI) في Azure Batch.
حزمة Microsoft HPC - حزمة HPCتتضمن بيئة وقت تشغيل لـ MS-MPI التي تستخدم شبكة Azure RDMA عند توزيعها على أجهزة Linux الظاهرية القادرة على RDMA. عمليات توزيع على سبيل المثال، راجع إعداد مجموعة Linux RDMA باستخدام حزمة HPC لتشغيل تطبيقات MPI.
اعتبارات النشر
اشتراك Azure - لتوزيع أكثر من عدد قليل من المثيلات كثيفة الحوسبة، فكر في اشتراك الدفع أولاً بأول أو خيارات الشراء الأخرى. إذا كنت تستخدم حساباً مجانياً في Azure، فيمكنك استخدام عدد محدود فقط من نوى حساب Azure.
التسعير والتوفر - تحقق من تسعير الجهاز الظاهري وتوافره حسب مناطق Azure.
حصة النوى - قد تحتاج إلى زيادة حصة النوى في اشتراك Azure من القيمة الافتراضية. قد يحد اشتراكك أيضاً من عدد النوى التي يمكنك توزيعها في عائلات أحجام أجهزة ظاهرية معينة، بما في ذلك السلسلة H. لطلب زيادة الحصص، افتح طلب دعم العملاء عبر الإنترنت مجاناً. (قد تختلف الحدود الافتراضية وفقاً لفئة اشتراكك.)
إشعار
اتصل بدعم Azure إذا كانت لديك احتياجات سعة واسعة النطاق. حصص Azure هي حدود ائتمانية، وليست ضمانات للسعة. بغض النظر عن حصتك، تتم محاسبتك فقط على النوى التي تستخدمها.
الشبكة الظاهرية - لا يلزم وجود شبكة Azure الظاهرية لاستخدام المثيلات كثيفة الحوسبة. ومع ذلك، بالنسبة للعديد من عمليات التوزيع، تحتاج على الأقل إلى شبكة Azure ظاهرية مستندة إلى السحابة، أو اتصال من موقع إلى موقع إذا كنت بحاجة إلى الوصول إلى الموارد المحلية. عند الحاجة، قم بإنشاء شبكة ظاهرية جديدة لتوزيع المثيلات. لا يتم دعم إضافة أجهزة ظاهرية كثيفة الحوسبة إلى شبكة ظاهرية في مجموعة ترابط.
تغيير الحجم - نظراً لأجهزتها المتخصصة، يمكنك فقط تغيير حجم المثيلات كثيفة الحوسبة ضمن نفس عائلة الحجم (السلسلة H أو السلسلة N). على سبيل المثال، يمكنك فقط تغيير حجم جهاز ظاهري من السلسلة H من أحد أحجام السلسلة H إلى آخر. قد يلزم النظر في اعتبارات إضافية حول دعم برنامج تشغيل InfiniBand وأقراص NVMe لبعض الأجهزة الظاهرية.
الخطوات التالية
- تعرف على المزيد حول تكوين الأجهزة الظاهرية، وتمكين InfiniBand، وإعداد MPI وتحسين تطبيقات الحوسبة عالية الأداء لـ Azure في أحمال عمل الحوسبة عالية الأداء.
- راجع نظرة عامة على سلسلة HBv3 ونظرة عامة على سلسلة HC.
- اقرأ بشأن أحدث الإعلانات، والأمثلة حول حمل عمل الحوسبة عالية الأداء (HPC)، ونتائج الأداء في مدوّنات المجتمع التقني حول الحساب في Azure.
- من أجل عرض هندسي ذي مستوى أعلى لتشغيل أحمال عمل الحوسبة عالية الأداء (HPC)، راجع الحوسبة عالية الأداء (HPC) على Azure.