التعافي من الكوارث وتجاوز الفشل لملفات Azure
تسعى Microsoft جاهدة لضمان إتاحة خدمات Azure دائمًا. ومع ذلك، قد تحدث انقطاعات غير مخطط لها في الخدمة، ويجب أن يكون لديك خطة للتعافي من الكوارث (DR) للتعامل مع انقطاع الخدمة الإقليمي. يتم التحضير لجزء هام من خطة استرداد الكوارث للفشل إلى نقطة النهاية الثانوية في حالة عدم وجود نقطة النهاية الأساسية. توضح هذه المقالة المفاهيم والعمليات المتضمنة في التعافي من الكوارث (DR) وتجاوز فشل حساب التخزين.
هام
لا تدعم Azure File Sync تجاوز فشل حساب التخزين إلا إذا فشلت خدمة مزامنة التخزين أيضا. وذلك لأن Azure File Sync يتطلب أن يكون حساب التخزين وخدمة مزامنة التخزين في نفس منطقة Azure. إذا تم تجاوز فشل حساب التخزين فقط، فستفشل عمليات المزامنة والطبقة السحابية حتى يتم تجاوز فشل خدمة مزامنة التخزين إلى المنطقة الثانوية. إذا كنت ترغب في تجاوز الفشل عبر حساب تخزين يحتوي على مشاركات ملفات Azure التي يتم استخدامها كنقاط نهاية سحابية في Azure File Sync، راجع أفضل ممارسات استرداد الكوارث ل Azure File Sync واسترداد خادم Azure File Sync.
تجاوز الفشل المخطط له من قبل العميل (معاينة)
يمكن أيضا استخدام تجاوز الفشل المخطط له من قبل العميل في سيناريوهات متعددة، بما في ذلك اختبار التعافي من الكوارث المخطط له، أو نهج استباقي للكوارث واسعة النطاق، أو للتعافي من الانقطاعات غير المتعلقة بالتخزين.
أثناء عملية تجاوز الفشل المخطط لها، يتم تبديل المناطق الأساسية والثانوية. يتم تخفيض المنطقة الأساسية الأصلية وتصبح المنطقة الثانوية الجديدة. وفي الوقت نفسه، يتم ترقية المنطقة الثانوية الأصلية وتصبح المنطقة الأساسية الجديدة. بعد اكتمال تجاوز الفشل، يمكن للمستخدمين المتابعة للوصول إلى البيانات في المنطقة الأساسية الجديدة ويمكن للمسؤولين التحقق من صحة خطة التعافي من الكوارث الخاصة بهم. يجب أن يكون حساب التخزين متوفرا في كل من المناطق الأساسية والثانوية قبل بدء تجاوز الفشل المخطط له.
لا يتوقع فقدان البيانات أثناء عملية تجاوز الفشل وإرجاع الموارد المخطط لها طالما أن المناطق الأساسية والثانوية متاحة طوال العملية بأكملها. لمزيد من التفاصيل، راجع قسم توقع فقدان البيانات وعدم التناسق .
لفهم تأثير هذا النوع من تجاوز الفشل على المستخدمين والتطبيقات، من المفيد معرفة ما يحدث أثناء كل خطوة من عمليات تجاوز الفشل وإرجاع الموارد المخطط لها. للحصول على تفاصيل حول كيفية عمل هذه العملية، راجع كيفية عمل تجاوز الفشل المدار من قبل العميل (المخطط له).
هام
تجاوز الفشل المخطط له من قبل العميل قيد المعاينة حاليا ويقتصر على المناطق التالية:
- شرق آسيا
- جنوب شرق آسيا
- شرق أستراليا
- جنوب شرق أستراليا
- وسط فرنسا
- جنوب فرنسا
- وسط الهند
- غرب الهند
- غرب سويسرا
- شمال سويسرا
للاشتراك في المعاينة، راجع إعداد ميزات المعاينة في اشتراك Azure وحدد AllowSoftFailover كاسم الميزة. اسم الموفر لميزة المعاينة هذه هو Microsoft.Storage.
للحصول على الشروط القانونية التي تنطبق على ميزات Azure الموجودة في الإصدار التجريبي، أو المعاينة، أو التي لم يتم إصدارها بعد في التوفر العام، راجع شروط الاستخدام التكميلية لمعاينات Microsoft Azure.
هام
بعد تجاوز الفشل المخطط له، قد تظهر قيمة وقت المزامنة الأخيرة (LST) لحساب التخزين قديمة أو يتم الإبلاغ عنها ك NULL عند وجود بيانات Azure Files.
يتم إنشاء لقطات النظام بشكل دوري في المنطقة الثانوية لحساب التخزين للحفاظ على نقاط استرداد متسقة مستخدمة أثناء تجاوز الفشل وإرجاع الموارد. يؤدي بدء تجاوز الفشل المخطط له من قبل العميل إلى أن تصبح المنطقة الأساسية الأصلية هي المنطقة الثانوية الجديدة. في بعض الحالات، لا توجد لقطات نظام متوفرة على الثانوي الجديد بعد اكتمال تجاوز الفشل المخطط له، مما يتسبب في ظهور قيمة LST الإجمالية للحساب قديمة أو عرضها ك Null
.
نظرا لأن أنشطة المستخدم مثل إنشاء الكائنات أو تعديلها أو حذفها يمكن أن تؤدي إلى إنشاء لقطة، فلن يتطلب أي حساب تحدث عليه هذه الأنشطة بعد تجاوز الفشل المخطط له اهتماما إضافيا. ومع ذلك، قد تستمر الحسابات التي لا تحتوي على لقطات أو نشاط مستخدم في عرض Null
قيمة LST حتى يتم تشغيل إنشاء لقطة النظام.
إذا لزم الأمر، فنفذ أحد الأنشطة التالية لكل مشاركة داخل حساب تخزين لتشغيل إنشاء لقطة. عند الانتهاء، يجب أن يعرض حسابك قيمة LST صالحة في غضون 30 دقيقة.
- قم بتحميل المشاركة، ثم افتح أي ملف للقراءة.
- تحميل ملف اختبار أو نموذج إلى المشاركة.
مقاييس الاسترداد والتكاليف
لصياغة استراتيجية فعالة للتعافي من الكوارث، يجب أن تفهم المؤسسة ما يلي:
- كم من البيانات يمكن أن تتحمل خسارتها في حالة حدوث انقطاع (هدف نقطة الاسترداد أو هدف نقطة الاسترداد)
- مدى السرعة التي يحتاجها لكي يكون قادرا على استعادة وظائف الأعمال والبيانات (هدف وقت الاسترداد أو RTO)
تزداد تكلفة الاسترداد بعد الكوارث بشكل عام مع RPO/RTO أقل أو صفر. الشركات التي تحتاج إلى أن تكون قيد التشغيل في غضون ثوان قليلة بعد وقوع كارثة ولا يمكنها تحمل أي فقدان للبيانات ستدفع المزيد مقابل الاسترداد بعد الكارثة، بينما ستدفع الشركات ذات أرقام RPO/RTO أعلى أقل. يوفر Azure حلولا يمكنها العمل مع متطلبات RPO وRTO المختلفة.
اختيار خيار التكرار المناسب
توفر Azure Files خيارات تكرار مختلفة لحماية بياناتك من الأحداث المخطط لها وغير المخطط لها بدءا من حالات الفشل العابر للأجهزة وانقطاع الشبكة والطاقة، إلى الكوارث الطبيعية. يمكن لجميع مشاركات ملفات Azure استخدام التخزين المتكرر محليا (LRS) أو التخزين المتكرر في المنطقة (ZRS). لمزيد من المعلومات، راجع تكرار ملفات Azure.
تدعم Azure Files تجاوز فشل الحساب لحسابات التخزين القياسية المكونة مع التخزين المتكرر جغرافيا (GRS) والتخزين المتكرر للمنطقة الجغرافية (GZRS) للحماية من الانقطاعات الإقليمية. باستخدام تجاوز فشل الحساب، يمكنك بدء عملية تجاوز الفشل لحساب التخزين الخاص بك إذا أصبحت نقطة النهاية الأساسية غير متوفرة. يقوم تجاوز الفشل بتحديث نقطة النهاية الثانوية لتصبح نقطة النهاية الأساسية لحساب التخزين الخاص بك. بمجرد اكتمال تجاوز الفشل، يمكن للعملاء البدء في الكتابة إلى نقطة النهاية الأساسية الجديدة.
لا يزال GRS وGZRS ينطويان على خطر فقدان البيانات لأنه يتم نسخ البيانات إلى المنطقة الثانوية بشكل غير متزامن، ما يعني أن هناك تأخيرا قبل نسخ الكتابة إلى المنطقة الأساسية إلى المنطقة الثانوية. في حالة انقطاع التيار الكهربائي، سيتم فقدان عمليات الكتابة إلى نقطة النهاية الأساسية التي لم يتم نسخها بعد إلى نقطة النهاية الثانوية. وهذا يعني أن الفشل الذي يؤثر على المنطقة الأساسية قد يؤدي إلى فقدان البيانات إذا تعذر استرداد المنطقة الأساسية. الفاصل الزمني بين أحدث عمليات الكتابة إلى المنطقة الأساسية وآخر كتابة إلى المنطقة الثانوية هو RPO. عادة ما يكون لدى Azure Files RPO لمدة 15 دقيقة أو أقل، على الرغم من عدم وجود اتفاقية على مستوى الخدمة حاليا حول المدة التي يستغرقها نسخ البيانات إلى المنطقة الثانوية.
هام
GRS/GZRS غير مدعوم لمشاركات ملفات Azure المتميزة. ومع ذلك، يمكنك المزامنة بين مشاركتي ملفات Azure لتحقيق التكرار الجغرافي.
التصميم لقابلية الوصول العالية
من المهم تصميم تطبيقك لجعله متوفرًا بشكل كبير من البداية. راجع موارد Azure هذه للحصول على إرشادات حول تصميم تطبيقك والتخطيط للتعافي من الكوارث:
- تصميم تطبيقات مرنة لـAzure: نظرة عامة على المفاهيم الأساسية لتصميم التطبيقات المتوفرة بشكل كبير في Azure.
- قائمة التحقق من المرونة: قائمة مرجعية للتحقق من أن تطبيقك ينفذ أفضل ممارسات التصميم للتوفر العالي.
- استخدم التكرار الجغرافي لتصميم التطبيقات عالية التوفر: إرشادات التصميم لبناء التطبيقات للاستفادة من التخزين المتكرر جغرافيا لمشاركات ملفات SMB.
نوصي أيضا بتصميم التطبيق الخاص بك للتحضير لإمكانية فشل الكتابة. يجب أن يعرض تطبيقك حالات فشل الكتابة بطريقة تنبهك إلى احتمال حدوث انقطاع في المنطقة الأساسية.
كأفضل ممارسة، قم بتصميم التطبيق الخاص بك للتحقق من خاصية آخر وقت مزامنة لتقييم فقدان البيانات المتوقع. على سبيل المثال، إذا كنت تقوم بتسجيل جميع عمليات الكتابة، فيمكنك مقارنة وقت عمليات الكتابة الأخيرة بوقت المزامنة الأخير لتحديد عمليات الكتابة التي لم تتم مزامنتها مع الثانوي.
تتبع الانقطاعات
يمكنك الاشتراك في Azure Service Health Dashboard لتتبع صحة وحالة Azure Files وخدمات Azure الأخرى.
فهم عملية تجاوز فشل الحساب
يتيح لك تجاوز فشل الحساب المدار من قبل العميل فشل حساب التخزين بالكامل في المنطقة الثانوية إذا أصبح الحساب الأساسي غير متوفر لأي سبب من الأسباب. عند فرض تجاوز فشل إلى المنطقة الثانوية، يمكن للعملاء البدء في كتابة البيانات إلى نقطة النهاية الثانوية بعد اكتمال تجاوز الفشل. عادة ما يستغرق تجاوز الفشل حوالي ساعة. نوصي بتعليق حمل العمل قدر الإمكان قبل بدء تجاوز فشل الحساب.
لمعرفة كيفية بدء تجاوز فشل حساب، راجع بدء تجاوز فشل الحساب.
كيفية عمل تجاوز الفشل في الحساب
في ظل الظروف العادية، يكتب العميل البيانات إلى حساب تخزين في المنطقة الأساسية، ويتم نسخ هذه البيانات بشكل غير متزامن إلى المنطقة الثانوية. تعرض الصورة التالية السيناريو عند توفر المنطقة الأساسية:
إذا أصبحت نقطة النهاية الأساسية غير متوفرة لأي سبب من الأسباب، فلن يتمكن العميل من الكتابة إلى حساب التخزين. توضح الصورة التالية السيناريو الذي أصبح فيه الأساسي غير متوفر، ولكن لم يحدث أي استرداد حتى الآن:
يبدأ العميل تجاوز فشل الحساب إلى نقطة النهاية الثانوية. تقوم عملية تجاوز الفشل بتحديث إدخال DNS الذي يوفره Azure Storage بحيث تصبح نقطة النهاية الثانوية نقطة النهاية الأساسية الجديدة لحساب التخزين الخاص بك، كما هو موضح في الصورة التالية:
تتم استعادة الوصول إلى الكتابة للحسابات الزائدة جغرافيًا بمجرد تحديث إدخال DNS وتوجيه الطلبات إلى نقطة النهاية الأساسية الجديدة. تظل نقاط نهاية خدمة التخزين الحالية كما هي بعد تجاوز الفشل. لا يتم الاحتفاظ بمقابض الملفات وعقود الإيجار عند تجاوز الفشل، لذلك يجب على العملاء إلغاء تحميل مشاركات الملفات وإعادة تحميلها.
هام
بعد اكتمال تجاوز الفشل، يتم تكوين حساب التخزين ليكون زائدا عن الحاجة محليا في نقطة النهاية/المنطقة الأساسية الجديدة. لاستئناف النسخ المتماثل إلى المرحلة الثانوية الجديدة، قم بتكوين حساب التكرار الجغرافي مرة أخرى.
ضع في اعتبارك أن تحويل حساب تخزين متكرر محليًا لاستخدام التكرار الجغرافي يتكبد التكلفة والوقت على حد سواء. لمزيد من المعلومات، راجع وقت وتكلفة تجاوز الفشل.
توقع فقدان البيانات
تنبيه
عادة ما ينطوي تجاوز فشل الحساب على بعض فقدان البيانات. من المهم فهم الآثار المترتبة على بدء تجاوز فشل الحساب.
نظرا لأن البيانات تتم كتابتها بشكل غير متزامن من المنطقة الأساسية إلى المنطقة الثانوية، إذا أصبحت المنطقة الأساسية غير متوفرة، فربما لم يتم نسخ أحدث عمليات الكتابة بعد إلى المنطقة الثانوية.
عند فرض تجاوز فشل، يتم فقدان كافة البيانات في المنطقة الأساسية حيث تصبح المنطقة الثانوية المنطقة الأساسية الجديدة. يتم تكوين المنطقة الأساسية الجديدة لتكون زائدة عن الحاجة محليًا بعد تجاوز الفشل.
يتم الاحتفاظ بجميع البيانات التي تم نسخها بالفعل إلى الثانوي عند حدوث تجاوز الفشل. ومع ذلك، سيتم فقدان أي بيانات مكتوبة إلى الأساسي لم يتم نسخها أيضا إلى الثانوي بشكل دائم.
تحقق من خاصية وقت آخر مزامنة
تشير الخاصية وقت المزامنة الأخير (LST) إلى أحدث وقت تضمن فيه كتابة البيانات من المنطقة الأساسية إلى المنطقة الثانوية. تتوفر جميع البيانات المكتوبة قبل وقت المزامنة الأخير على المستوى الثانوي، بينما قد لا تتم كتابة البيانات المكتوبة بعد وقت المزامنة الأخير إلى الثانوي وقد يتم فقدانها. استخدم هذه الخاصية في حالة انقطاع لتقدير مقدار فقدان البيانات الذي قد تتكبده عن طريق بدء تجاوز فشل الحساب.
للتأكد من أن مشاركات الملفات في حالة متناسقة عند حدوث تجاوز فشل، يتم إنشاء لقطة نظام في المنطقة الأساسية كل 15 دقيقة ويتم نسخها نسخا متماثلا إلى المنطقة الثانوية. عند حدوث تجاوز فشل للمنطقة الثانوية، ستستند حالة المشاركة إلى أحدث لقطة نظام في المنطقة الثانوية. إذا حدث فشل في المنطقة الأساسية، فمن المحتمل أن تكون المنطقة الثانوية خلف المنطقة الأساسية، حيث لن يتم بعد نسخ جميع عمليات الكتابة إلى الأساسي إلى المنطقة الثانوية. نظرا للتأخر الجغرافي أو مشكلات أخرى، قد تكون أحدث لقطة للنظام في المنطقة الثانوية أقدم من 15 دقيقة.
تم نسخ جميع عمليات الكتابة المكتوبة إلى المنطقة الأساسية قبل LST بنجاح إلى المنطقة الثانوية، ما يعني أنها متاحة للقراءة من المنطقة الثانوية. قد يتم نسخ أي عمليات كتابة مكتوبة إلى المنطقة الأساسية بعد وقت المزامنة الأخير أو ربما لم يتم نسخها نسخا متماثلا إلى المنطقة الثانوية، ما يعني أنها قد لا تكون متوفرة لعمليات القراءة.
يمكنك الاستعلام عن قيمة الخاصية Last Sync Time باستخدام Azure PowerShell أو Azure CLI أو مكتبة العميل. الخاصية وقت المزامنة الأخير هي قيمة تاريخ/ وقت غرينيتش. لمزيد من المعلومات، راجع التحقق من الخاصية وقت المزامنة الأخير لحساب تخزين.
توخي الحذر عند الفشل في العودة إلى المرحلة الأساسية الأصلية
كما ذكر سابقا، بعد تجاوز الفشل من المنطقة الأساسية إلى المنطقة الثانوية، يتم تكوين حساب التخزين الخاص بك ليكون مكرر محليا في المنطقة الأساسية الجديدة. يمكنك بعد ذلك تكوين الحساب في المنطقة الأساسية الجديدة للتكرار الجغرافي. عندما يتم تكوين الحساب للتكرار الجغرافي بعد تجاوز الفشل، تبدأ المنطقة الأساسية الجديدة على الفور في نسخ البيانات إلى المنطقة الثانوية الجديدة، والتي كانت الأساسية قبل تجاوز الفشل الأصلي. ومع ذلك، قد يستغرق الأمر بعض الوقت قبل نسخ البيانات الموجودة في الأساسي الجديد بالكامل إلى الثانوي الجديد.
بعد إعادة تكوين حساب التخزين للتكرار الجغرافي، من الممكن بدء عملية استرداد فشل من الإصدار الأساسي الجديد إلى الإصدار الثانوي الجديد. في هذه الحالة، تصبح المنطقة الأساسية الأصلية قبل تجاوز الفشل المنطقة الأساسية مرة أخرى، ويتم تكوينها لتكون إما زائدة عن الحاجة محليا أو متكررة في المنطقة، اعتمادا على ما إذا كان التكوين الأساسي الأصلي هو GRS أو GZRS. يتم فقدان كافة البيانات في المنطقة الأساسية بعد تجاوز الفشل (الثانوية الأصلية) في أثناء عملية إعادة الفشل. إذا لم يتم نسخ معظم البيانات الموجودة في حساب التخزين إلى الثانوي الجديد قبل أن تفشل مرة أخرى، فقد تعاني من فقدان كبير للبيانات.
لتجنب فقدان كبير للبيانات، تحقق من قيمة الخاصية "وقت المزامنة الأخير" قبل الفشل. قارن آخر وقت مزامنة بآخر مرة تمت فيها كتابة البيانات إلى الإصدار الأساسي الجديد لتقييم فقدان البيانات المتوقع.
بعد عملية رد الفشل، يمكنك تكوين المنطقة الأساسية الجديدة لتكون زائدة عن الحاجة جغرافيًا مرة أخرى. إذا تم تكوين الأساسي الأصلي ل LRS، يمكنك تكوينه ليكون GRS. إذا تم تكوين الأساسي الأصلي ل ZRS، يمكنك تكوينه ليكون GZRS. للحصول على خيارات إضافية، راجع تغيير كيفية نسخ حساب التخزين على نسخة متماثلة.
بدء تجاوز فشل الحساب
يمكنك بدء تجاوز فشل الحساب من مدخل Microsoft Azure أو PowerShell أو Azure CLI أو واجهة برمجة تطبيقات موفر موارد تخزين Azure. لمزيد من المعلومات حول كيفية بدء تجاوز الفشل، راجع بدء تجاوز فشل الحساب.
تجاوز الفشل المدار من Microsoft
في الظروف القصوى التي تفقد فيها منطقة بسبب كارثة كبيرة، قد تبدأ Microsoft في تجاوز الفشل الإقليمي. في هذه الحالة، لا يلزم اتخاذ أي إجراء من جانبك. إلى أن يكتمل تجاوز الفشل المدار من قبل Microsoft، لن تتمكن من الوصول للكتابة إلى حساب التخزين الخاص بك.