اقرأ باللغة الإنجليزية

مشاركة عبر


الجاهزية للحوادث في Microsoft Azure

عند الإعلان عن حادث Azure، ننقل التحديثات إلى الاشتراكات أو المستأجرين المتأثرين عبر شفرة مشكلات الخدمة في Azure Service Health (داخل مدخل Microsoft Azure).

قبل وقوع حادث

نوصي بالخطوات التالية للتحضير والمساعدة في حماية مؤسستك:

الحصول على إعلام والبقاء على اطلاع دائم بالحوادث التي تؤثر على خدمات Azure

  1. تعرف على Azure Service Health في مدخل Microsoft Azure - مكان "الانتقال إلى" في حالة حدوث مشكلات.

  2. قم بتكوين تنبيهات Service Health لإعلامك بأي مشكلات - عن طريق البريد الإلكتروني أو الرسائل النصية القصيرة أو خطاف الويب وما إلى ذلك على مستوى الاشتراك أو حسب الخدمة (الخدمات) و/ أو حسب المنطقة (المناطق).

    • سيحذر نوع إعلام مشكلات الخدمة مؤسستك من أن خدماتك تتأثر بحوادث الخدمة.

    • سيقوم نوع الإعلام الإرشادي للأمان بتنبيه مؤسستك بأن خدماتك تتأثر إما بحادث أمني أو حادث خصوصية.

    فيما يلي توصيات تكوين التنبيه الأساسي:

    • بالنسبة لمشكلات الخدمة، أنواع الاستشارات الصحية والصيانة المخطط لها :

      • أحمال العمل الهامة الخاصة بك - تنبيهات الإعداد للاشتراك (الاشتراكات) والخدمة التي تعمل على تشغيل حمل العمل (أحمال العمل) الهامة.
      • إعداد التنبيهات للخدمات الأساسية في مكدس Azure:
        • خدمة "البنية الأساسية للشبكة" - الطبقة الأساسية في مكدس Azure الذي تعتمد عليه جميع أنواع أحمال العمل والتطبيقات من IaaS إلى SaaS.
        • خدمة "مدخل Microsoft Azure" - الخدمة التأسيسية المستخدمة لإدارة موارد Azure. تجعله متعدد الاستخدامات بمثابة خدمة "شاملة"، تغطي مجموعة متنوعة من السيناريوهات، وتجارب ملخص التأثير التي سيتم توصيلها في إطار هذه الخدمة.
    • بالنسبة لنوع «Security Advisories» :

      • جميع اشتراكات وخدمات Azure - عادة ما تستهدف الجهات الفاعلة السيئة الموارد الأقل استخداما، لذلك من المهم أن يغطي هذا النوع من التنبيه جميع موارد Azure

    بالإضافة إلى ذلك، يوفر حل Azure Monitor Baseline Alerts إرشادات ورمزا شاملا لتنفيذ خط أساسي لتنبيهات النظام الأساسي بالإضافة إلى تنبيه سلامة الخدمة عبر النهج والمبادرات في بيئات Azure، مع خيارات للتوزيع التلقائي أو اليدوي.

  3. تأكد من أن الأدوار التالية تحتوي على معلومات الاتصال الصحيحة وتتم مراجعتها بانتظام للبقاء على اطلاع. لمزيد من المعلومات، يرجى مراجعة البقاء على اطلاع على مشكلات أمان Azure - Azure Service Health | Microsoft Learn)

    • مسؤول الاشتراك ومالك الاشتراك – جهات الاتصال التي سيتم استخدامها لتلقي الإعلامات (عبر مدخل Microsoft Azure و/أو البريد الإلكتروني، اعتمادا على متطلبات الاتصال) لمشكلات الأمان التي تؤثر على مستوى الاشتراك.

    • المسؤول العمومي للمستأجر وجهات الاتصال التقنية - جهات الاتصال التي سيتم استخدامها لتلقي الإشعارات (عبر مدخل Microsoft Azure و/أو البريد الإلكتروني، اعتمادا على متطلبات الاتصال) لمشكلات الأمان التي تؤثر على مستوى المستأجر.

    • مسؤول الأمان - يمكنه مراجعة نهج الأمان وإجراء تغييرات عليه، وتطبيق التوصيات، وعرض التنبيهات ورفضها.

  4. ضع في اعتبارك استخدام التنبيهات الصحية أو الأحداث المجدولة للبقاء على اطلاع على المشكلات الخاصة بحيث يمكن إعلام الأشخاص والأنظمة الخاصة بك حول المشكلات الخاصة وأحداث الصيانة القادمة.

لفهم مبادئ اتصال Azure، يرجى مراجعة تطوير تجربة الانقطاع - التشغيل التلقائي والاتصال والشفافية | مدونة وتحديثات Azure | Microsoft Azure.

زيادة وضع الأمان والمرونة لتجنب أو تقليل تأثير الحوادث

  1. مراجعة وتنفيذ أفضل ممارسات الأمان التشغيلي لحماية بياناتك وتطبيقاتك وأصولك الأخرى، خاصة ما يلي:

    • فرض المصادقة متعددة العوامل للتخفيف من المخاوف بشأن التعرض.

    • تنفيذ التنبيهات للمستخدمين المعرضين لمخاطر عالية. قم بتكوين الوصول المشروط للتأكد من إعلامك عند وجود "مستخدم محفوف بالمخاطر" في بيئتك.

    • التحكم في حركة الاشتراكات من وإلى الدلائل. لأغراض الحوكمة، يمكن للمسؤولين العموميين السماح لمستخدمي الدليل أو عدم السماح لهم بتغيير الدلائل غير المعروفة داخل مؤسستهم. يضمن هذا أن مؤسستك لديها رؤية كاملة للاشتراكات المستخدمة ضمن دلائل مؤسستك وتمنع حركة الاشتراكات التي قد تنتقل إلى دليل غير معروف.

  2. تحسين موثوقية حمل العمل الحرجة والأمان والمزيد باستخدام Azure Well-Architected Framework (WAF) والمراجعة. يرجى أيضا النظر في هذه الإجراءات لتكمل العمل في WAF.

    • استفد من مصنف الموثوقية، المدمج في مدخل Azure ضمن شفرة Azure Advisor، لمراجعة وضع الموثوقية لتطبيقاتك وتقييم المخاطر وتخطيط التحسينات.

    • توسيع حمل العمل/ عمليات النشر عبر المناطق لاستمرارية الأعمال والتعافي من الكوارث (BCDR). استخدم القائمة الكاملة المنشورة لأزواج منطقة Azure.

    • توسيع حمل العمل/ عمليات النشر داخل منطقة عبر مناطق التوفر.

    • ضع في اعتبارك العزل للأجهزة الظاهرية في Azure - أجهزة Azure الظاهرية | Microsoft Learn لأحمال العمل المهمة للأعمال.

    • ضع في اعتبارك تكوينات الصيانة للقدرة على التحكم في التحديثات وإدارتها للعديد من أجهزة Azure الظاهرية

    • استخدم Azure Chaos Studio لتقييم مرونة تطبيقات Azure. اخضع تطبيقات Azure الخاصة بك إلى أخطاء يتم التحكم فيها، حقيقية أو محاكاة، لمراقبة مرونة التطبيق والاستجابة للاضطرابات مثل زمن انتقال الشبكة وانقطاع التخزين والأسرار منتهية الصلاحية وانقطاع مركز البيانات.

    • استخدم مصنف تقاعد الخدمة، المدمج في مدخل Microsoft Azure ضمن شفرة Azure Advisor، كعرض مركزي واحد لمستوى الموارد لإيقاف الخدمة. يساعدك على تقييم التأثير وتقييم الخيارات والتخطيط للترحيل من الخدمات والميزات المتوقفة.

يرجى اتباع مدونة Azure Advancing Reliability للبقاء على اطلاع على جهود Azure في جهود المرونة المستمرة.

أثناء وقوع حادث

عندما تتأثر اشتراكاتك الرئيسية بحادث ما، من المهم أن تعرف مكان وكيفية العثور على الاتصالات ذات الصلة المحيطة بهذا الحادث:

  1. راجع تنبيهات Azure Service Health في مدخل Microsoft Azure للحصول على آخر التحديثات من مهندسينا.

    • من المهم ملاحظة أن جهات اتصال الدور المحددة المذكورة في قسم "قبل وقوع حادث" (على سبيل المثال، مسؤول الاشتراك / المالك، جهة الاتصال التقنية / الخصوصية، مسؤول المستأجر) قد تتلقى أيضا إشعارات بالبريد الإلكتروني لحوادث الأمان أو الخصوصية.
  2. إذا كانت هناك مشكلات في الوصول إلى المدخل، فتحقق من صفحة حالة Azure العامة azure.status.microsoft كنسخة احتياطية.

  3. إذا كانت هناك أي مشكلات في صفحة الحالة، فتحقق من وجود أي تحديثات عبر @AzureSupport على "X" (المعروف سابقا باسم Twitter).

لماذا تستخدم Service Health بدلا من صفحة الحالة العامة؟

يتحقق العديد من العملاء من صفحات الحالة التي يمكن الوصول إليها بشكل عام (مثل azure.status.microsoft) عند العلامات الأولى للمشكلات المحتملة، لمعرفة ما إذا كانت هناك مشكلات معروفة في خدمات السحابة الخاصة بنا. تعرض هذه الصفحات فقط مشكلات واسعة النطاق تفي بمعايير معينة، وليس حوادث أصغر تؤثر على عدد أقل من العملاء.

تعرف Azure Service Health (داخل مدخل Microsoft Azure) الاشتراكات والمستأجرين الذين تديرهم، لذلك تظهر طريقة عرض أكثر دقة لأي مشكلات معروفة تؤثر على انقطاع التيار الكهربائي. كما يتيح لك تكوين التنبيهات، بحيث يمكن إعلامك تلقائيا.

متى يكون من المفيد فتح حالة دعم؟

إذا تم بالفعل الإبلاغ عن حادث الخدمة عبر حالة الخدمة، توفير جميع المعلومات الأخيرة هنا، ولا حاجة لفتح طلب دعم. إذا كنت تعتقد أنك متأثر بحادث خدمة ولكنك لا ترى المشكلة ممثلة في صفحة حماية الخدمة، فيرجى فتح طلب دعم.

إذا كانت هناك أسئلة لا تغطيها مواد مشكلات الأمان المستلمة، فيرجى فتح طلب دعم يشير إلى معرف التعقب.

بعد وقوع حادث

  1. اقرأ مراجعة ما بعد الحادث (PIR) من جزء محفوظات الصحة في Azure Service Health (أو عبر تنبيهات حالة الخدمة المكونة من قبل العميل) لفهم ما تعلمناه.

  2. بالنسبة للحوادث الرئيسية التي تفي بمعايير صفحة الحالة العامة الخاصة بنا، انضم إلى بث مباشر بأثر رجعي لحوادث Azure للحصول على إجابات على أي أسئلة، أو شاهد التسجيل.

  3. إذا كنت تعتقد أنك قد تكون مؤهلا للحصول على رصيد اتفاقية مستوى الخدمة،فبادر بإنشاء طلب دعم جديد بنوع مشكلة "طلب استرداد المبلغ" - وقم بتضمين معرف تعقب الحوادث.