مشاركة عبر


الإصلاح بعد كارثة باستخدام الأداة Azure Application Consistent Snapshot

توضح هذه المقالة كيفية إجراء التعافي من الكوارث عند استخدام أداة Azure Application Consistent Snapshot التي يمكنك استخدامها مع Azure NetApp Files.

هام

تنطبق هذه العملية على Azure Large Instance فقط.

مقدمة

يمكن أن يحتوي النظام الأساسي ل Azure Large Instance أيضا على موقع استرداد بعد الكوارث تم تكوينه حيث يمكن نسخ لقطات وحدة التخزين نسخا متماثلا إليه. إذا تم تكوين اللقطات بشكل صحيح مع مثل هذا الإعداد، فمن الممكن إجراء الإصلاح بعد الكوارث في هذا الموقع. يهدف هذا المستند إلى أن يكون دليلا لتنفيذ الإصلاح بعد الكوارث لهذا الإعداد.

المتطلبات الأساسية لإعداد التعافي من الكوارث

يجب استيفاء المتطلبات المسبقة التالية قبل التخطيط لتجاوز فشل التعافي من الكوارث.

  • لديك عقدة DR تم توفيرها في موقع DR. هناك خياران للتعافي من الكوارث. أحدهما هو DR العادي، والآخر هو DR متعدد الأغراض.
  • لديك نسخ متماثل للتخزين يعمل. يقوم فريق عمليات Microsoft بإعداد النسخ المتماثل للتخزين في وقت توفير DR تلقائيا. يمكنك مراقبة النسخ المتماثل للتخزين باستخدام الأمر azacsnap -c details --details replication في موقع DR.
  • لقد قمت بإعداد وتكوين لقطات التخزين في الموقع الأساسي.
  • لديك مثيل HANA مثبت في موقع DR الأساسي بنفس SID الذي يحتوي عليه المثيل الأساسي.
  • يمكنك قراءة وفهم إجراء تجاوز فشل DR الموضح في SAP HANA Large Instances قابلية وصول عالية والتعافي من الكوارث على Azure
  • لقد قمت بإعداد وتكوين لقطات التخزين في موقع DR.
  • تم إنشاء ملف تكوين (على سبيل المثال، DR.json) مع وحدات تخزين DR والمعلومات المقترنة على خادم DR.
  • لقد أكملت الخطوات في موقع DR من أجل:
    • تمكين الاتصال بالتخزين.
    • تمكين الاتصال مع SAP HANA.

إعداد عملية الإصلاح بعد الكارثة

تدعم Microsoft النسخ المتماثل على مستوى التخزين لاسترداد DR. هناك طريقتان لإعداد DR.

أحدهما طبيعي والآخر متعدد الأغراض. في DR العادي ، لديك مثيل مخصص في موقع DR لتجاوز الفشل. في سيناريو التعافي من الكوارث متعدد الأغراض، لديك مثيل آخر ل QA أو Development HANA يعمل على وحدة مثيل HANA الكبير في موقع DR. ولكن قمت أيضا بتثبيت مثيل HANA المثبت مسبقا وهو غير صالح ولديه نفس SID مثل مثيل HANA الذي تريد تجاوز الفشل إلى وحدة HANA Large Instance هذه. تقوم عمليات Microsoft بإعداد البيئة لك بما في ذلك النسخ المتماثل للتخزين استنادا إلى الإدخال المقدم في نموذج طلب الخدمة (SRF) في وقت الإعداد.

هام

تأكد من استيفاء جميع المتطلبات الأساسية لإعداد DR.

مراقبة النسخ المتماثل للبيانات من موقع Primary إلى DR

يقوم فريق عمليات Microsoft بالفعل بإدارة ومراقبة ارتباط DR من الموقع الأساسي إلى موقع DR. يمكنك مراقبة النسخ المتماثل للبيانات من الخادم الأساسي إلى خادم DR باستخدام أمر azacsnap -c details --details replicationاللقطة .

تنفيذ تجاوز الفشل إلى موقع الاسترداد بعد الكوارث

قم بتشغيل أمر تجاوز الفشل في موقع DR (azacsnap -c restore --restore revertvolume).

هام

يقسم azacsnap -c restore --restore revertvolume الأمر النسخ المتماثل للتخزين من موقع الإنتاج إلى موقع DR. يجب عليك التواصل مع عمليات Microsoft لإعداد النسخ المتماثل مرة أخرى. بمجرد إعادة تمكين النسخ المتماثل، ستتم تهيئة جميع البيانات في تخزين DR لمعرف الأمان هذا. يتيح الأمر الذي يقوم بتجاوز الفشل لقطة التخزين المنسوخة نسخا متماثلا مؤخرا. إذا كنت بحاجة إلى الاستعادة مرة أخرى إلى لقطة قديمة، فافتح طلب دعم حتى تتمكن العمليات من المساعدة في توفير لقطة سابقة تمت استعادتها في موقع الاسترداد بعد الكوارث.

على مستوى عال، فيما يلي الخطوات التي يجب اتباعها لتجاوز فشل DR:

  • يجب إيقاف تشغيل مثيل HANA في الموقع الأساسي . هذا الإجراء مطلوب فقط إذا كنت تقوم حقا بتجاوز الفشل إلى موقع DR حتى لا يكون لديك تناقضات في البيانات.
  • إيقاف تشغيل مثيل HANA على عقدة DR ل SID الإنتاج.
  • تنفيذ الأمر azacsnap -c restore --restore revertvolume على عقدة DR مع SID المراد استرداده
    • الأمر يكسر ارتباط النسخ المتماثل للتخزين من الأساسي إلى موقع DR
    • يستعيد الأمر وحدة التخزين /data و/logbackups فقط، ولا يتم استرداد وحدة التخزين المشتركة/المشتركة، ولكن بدلا من ذلك يستخدم /shared ل SID الموجود في موقع DR.
    • تحميل وحدة التخزين /data و/logbackups - تأكد من إضافته إلى ملف fstab
  • استعادة لقطة HANA SYSTEMDB. يظهر لك استوديو HANA فقط أحدث لقطة HANA المتوفرة ضمن لقطة التخزين المستعادة كجزء من تنفيذ الأمر azacsnap -c restore --restore revertvolume .
  • استرداد قاعدة بيانات المستأجر.
  • ابدأ تشغيل مثيل HANA على موقع DR لمعرف SID للإنتاج (مثال: H80 في هذه الحالة).
  • إجراء الاختبار.

مثال على إجراء التعافي من الكوارث

يصف هذا القسم الفرعي الخطوات التفصيلية لتجاوز الفشل إلى موقع التعافي من الكوارث.

الخطوة 1: الحصول على تفاصيل وحدة التخزين لعقدة DR

قم بتنفيذ الأمر df –h لسرد أنظمة الملفات ووحدات التخزين المقترنة للإشارة إليها بعد تجاوز الفشل.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

الخطوة 2: إيقاف تشغيل HANA على الموقع الأساسي

إذا كان تنفيذ تجاوز فشل كامل لأحمال عمل الإنتاج، ومن الممكن الاتصال بموقع الإنتاج الأساسي، فتوقف عن تشغيل مثيل (مثيلات) SAP HANA التي تم تجاوز فشلها إلى DR.

على سبيل المثال، إذا تم تسجيل الدخول كجذر، يوضح المثال التالي كيف يمكن إيقاف تشغيل SAP HANA. استبدل <sid> بSAP HANA SID الخاص بك.

su - <sid>adm
HDB stop

الخطوة 3: إيقاف تشغيل HANA على موقع DR

من المهم إيقاف تشغيل SAP HANA على موقع التعافي من الكوارث قبل استعادة وحدات التخزين.

على سبيل المثال، إذا تم تسجيل الدخول كجذر، يوضح المثال التالي كيف يمكن إيقاف تشغيل SAP HANA. استبدل <sid> بSAP HANA SID الخاص بك.

su - <sid>adm
HDB stop

هام

تأكد من أن مثيلات HANA على موقع DR غير متصلة قبل استعادة أي وحدات تخزين.

الخطوة 4: استعادة وحدات التخزين

azacsnap -c restore --restore revertvolume --dbsid H80

إخراج أمر تجاوز الفشل DR.

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

إشعار

يجب اتخاذ الخطوات في نهاية عرض وحدة التحكم لإكمال إعداد التخزين لتجاوز فشل DR.

الخطوة 5: إلغاء تحميل أنظمة الملفات غير الضرورية

قم بتنفيذ الأمر umount لإلغاء تحميل أنظمة الملفات/وحدات التخزين غير المطلوبة.

umount <Mount point>

قم بإلغاء تحميل البيانات وسجل نقاط تحميل النسخ الاحتياطي. قد يكون لديك نقطة تحميل بيانات متعددة في سيناريو التوسيع.

الخطوة 6: تكوين نقاط التحميل

قم بتعديل الملف /etc/fstab للتعليق على إدخالات النسخ الاحتياطي للبيانات والسجلات لمعرف الأمان الأساسي (في هذا المثال، SID=H80) وإضافة إدخالات نقطة التحميل الجديدة التي تم إنشاؤها من وحدات تخزين DR للموقع الأساسي. يتم توفير إدخالات نقطة التحميل الجديدة في إخراج الأمر.

  • التعليق على نقاط التحميل الموجودة التي تعمل على موقع DR بالحرف # :

    #172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    
  • إضافة الأسطر التالية إلى /etc/fstab

    يجب أن يكون هذا هو نفس الإخراج من الأمر

    10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    

الخطوة 7: تحميل وحدات تخزين الاسترداد

تنفيذ الأمر mount –a لتحميل جميع نقاط التحميل.

mount -a

الآن، إذا قمت بتنفيذ df –h يجب أن ترى *_dp وحدات التخزين التي تم تحميلها.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

الخطوة 8: استرداد SYSTEMDB

من HANA Studio، انقر بزر الماوس الأيمن فوق مثيل SYSTEMDB واختر "النسخ الاحتياطي والاسترداد"، ثم "استرداد قاعدة بيانات النظام"

راجع الدليل لاسترداد قاعدة بيانات من لقطة، وتحديدا SYSTEMDB.

الخطوة 9: استرداد قاعدة بيانات المستأجر

من HANA Studio، انقر بزر الماوس الأيمن فوق مثيل SYSTEMDB واختر "النسخ الاحتياطي والاسترداد"، ثم "استرداد قاعدة بيانات المستأجر".

راجع الدليل لاسترداد قاعدة بيانات من لقطة، وتحديدا قاعدة بيانات المستأجر (قواعد البيانات).

تشغيل azacsnap -c backup في موقع التعافي من الكوارث

إذا كنت تقوم بتشغيل النسخ الاحتياطية المستندة إلى لقطة في موقع DR، يجب أن يكون اسم خادم HANA المكون في azacsnap ملف التكوين في موقع DR هو نفس اسم خادم الإنتاج.

هام

يمكن أن يؤدي azacsnap -c backup تشغيل إلى إنشاء لقطات تخزين في موقع DR، ولا يتم نسخها تلقائيا إلى موقع آخر. العمل مع عمليات Microsoft لفهم إرجاع أي ملفات أو بيانات إلى موقع الإنتاج الأصلي بشكل أفضل.

الخطوات التالية