Bagikan melalui


Daftar periksa tinjauan desain untuk Keandalan

Daftar periksa ini menyajikan serangkaian rekomendasi yang dapat Anda gunakan untuk mengevaluasi strategi keandalan, ketahanan, dan pemulihan kegagalan dalam desain arsitektur Anda. Untuk memastikan keandalan, identifikasi infrastruktur dan desain aplikasi terbaik untuk beban kerja Anda. Buat keputusan ini berdasarkan persyaratan bisnis Anda yang dipetakan ke metrik target ketersediaan dan pemulihan.

Untuk menerapkan desain yang andal, pertimbangkan secara menyeluruh poin keputusan dalam desain Anda dan ketahui bagaimana keputusan tersebut memengaruhi beban kerja Anda. Daftar periksa ini dan panduan yang menyertainya menyediakan sumber daya untuk membantu Anda membuat keputusan tersebut. Jadikan keandalan beban kerja sebagai pertimbangan terpusat di seluruh desain beban kerja, pengembangan, dan siklus hidup operasi.

Checklist

Dekati desain Anda dengan fokus pada keandalan untuk membantu memastikan bahwa Anda merancang beban kerja yang tangguh, dapat dikelola, dan dapat diulang. Jika Anda tidak menyertakan praktik keandalan dan mempertimbangkan tradeoff, desain Anda berpotensi berisiko. Pertimbangkan dengan cermat semua poin yang tercakup dalam daftar periksa untuk menanamkan keyakinan pada keberhasilan sistem Anda.

  Kode Rekomendasi
RE:01 Fokuskan desain beban kerja Anda pada kesederhanaan dan efisiensi. Gunakan pendekatan praktis untuk menghindari kompleksitas yang tidak perlu sambil memenuhi tujuan dan persyaratan bisnis Anda.
RE:02 Mengidentifikasi dan menilai alur pengguna dan sistem. Gunakan skala kritisitas berdasarkan persyaratan bisnis Anda untuk memprioritaskan alur.
RE:03 Gunakan analisis mode kegagalan (FMA) untuk mengidentifikasi potensi kegagalan dalam beban kerja Anda. Identifikasi dependensi dan titik kegagalan, dan kembangkan strategi mitigasi untuk kegagalan tersebut.
RE:04 Tentukan target keandalan dan pemulihan untuk beban kerja Anda. Gunakan target untuk menginformasikan desain Anda dan sebagai fondasi model kesehatan Anda.
RE:05
RE:05
RE:05
Tambahkan redundansi pada tingkat yang berbeda, terutama untuk alur kritis, untuk membantu memenuhi target keandalan Anda. Pertimbangkan komponen infrastruktur cadangan seperti komputasi dan jaringan, serta beberapa instans solusi Anda.
RE:06
RE:06
Menerapkan strategi penskalakan yang tepat waktu dan andal di tingkat aplikasi, data, dan infrastruktur. Mendasarkan strategi penskalaan pada pola penggunaan aktual atau yang diprediksi dan meminimalkan intervensi manual.
RE:07 Memperkuat ketahanan beban kerja Anda dengan menerapkan langkah-langkah pelestarian diri dan penyembuhan diri. Gunakan fitur bawaan dan pola cloud yang mapan untuk membantu beban kerja Anda tetap berfungsi selama dan pulih dari insiden.
RE:08 Uji ketahanan dan skenario ketersediaan dengan menerapkan prinsip-prinsip rekayasa chaos. Pastikan implementasi degradasi kinerja yang anggun dan strategi penskalaan Anda efektif dengan melakukan pengujian kegagalan aktif dan pengujian beban yang disimulasikan.
RE:09 Menerapkan rencana kelangsungan bisnis dan pemulihan bencana (BCDR) terstruktur, diuji, dan didokumentasikan yang selaras dengan target pemulihan. Paket harus mencakup semua komponen dan sistem secara keseluruhan.
RE:10 Mengukur dan memodelkan sinyal kesehatan solusi. Terus menerus mengumpulkan waktu kerja dan data keandalan lainnya dari seluruh beban kerja serta dari komponen individual dan alur utama.

Langkah berikutnya

Kami menyarankan agar Anda meninjau kompromi Keandalan untuk menjelajahi konsep lain.