Bagaimana memantau ketersediaan kluster dengan log Azure Monitor di Microsoft Azure HDInsight
Kluster Microsoft Azure HDInsight mencakup integrasi log Azure Monitor, yang menyediakan metrik dan log yang dapat dikueri, serta peringatan yang dapat dikonfigurasi. Artikel ini memperlihatkan cara menggunakan Azure Monitor untuk memantau kluster Anda.
Integrasi log Azure Monitor
Log Azure Monitor memungkinkan data yang dihasilkan oleh beberapa sumber daya, seperti kluster Microsoft Azure HDInsight, untuk dikumpulkan dan dikumpulkan di satu tempat untuk mencapai pengalaman pemantauan terpadu.
Sebagai prasyarat, Anda memerlukan Ruang Kerja Analitik Log untuk menyimpan data yang dikumpulkan. Jika belum membuatnya, Anda dapat mengikuti petunjuk di sini: Buat Ruang Kerja Analitik Log.
Aktifkan integrasi log Microsoft Azure HDInsight Azure Monitor
Dari halaman sumber daya kluster Microsoft Azure HDInsight di portal, pilih Azure Monitor. Kemudian, pilih aktifkan dan pilih ruang kerja Analitik Log Anda dari turun bawah.
Secara default, ini memasang agen OMS pada semua simpul kluster kecuali simpul tepi. Karena tidak ada agen OMS yang dipasang pada simpul tepi kluster, tidak ada telemetri pada simpul tepi yang ada di Log Analytics secara default.
Metrik kueri dan tabel log
Setelah integrasi log Azure Monitor diaktifkan (ini mungkin memakan waktu beberapa menit), arahkan ke sumber daya Ruang Kerja Analitik Log Anda dan pilih Log .
Log cantumkan sejumlah kueri sampel, seperti:
Nama kueri | Deskripsi |
---|---|
Ketersediaan komputer hari ini | Bagan jumlah komputer yang mengirim log, setiap jam |
Camtumkan detak jantung | Cantumkan semua detak jantung komputer dari satu jam terakhir |
Detak jantung terakhir dari setiap komputer | Tunjukkan detak jantung terakhir yang dikirim oleh setiap komputer |
Komputer yang tidak tersedia | Cantumkan semua komputer yang diketahui yang tidak mengirim detak jantung dalam 5 jam terakhir |
Tingkat ketersediaan | Hitung tingkat ketersediaan setiap komputer yang tersambung |
Sebagai contoh, jalankan kueri sampel laju ketersediaan dengan memilih Jalankan pada kueri itu, seperti yang diperlihatkan dalam cuplikan layar di atas. Ini akan menunjukkan tingkat ketersediaan setiap simpul di kluster Anda sebagai persentase. Jika Anda telah mengaktifkan beberapa kluster Microsoft Azure HDInsight untuk mengirim metrik ke ruang kerja Analitik Log yang sama, Anda akan melihat tingkat ketersediaan untuk semua simpul (tidak termasuk simpul tepi) di kluster yang ditampilkan.
Catatan
Tingkat ketersediaan diukur selama periode 24 jam, sehingga klusterster Anda harus berjalan setidaknya selama 24 jam sebelum Anda melihat tingkat ketersediaan yang akurat.
Anda dapat menyematkan tabel ini ke dasbor bersama dengan mengklik Sematkan di sudut kanan atas. Jika Anda tidak memiliki dasbor bersama yang dapat ditulis, Anda bisa melihat cara membuatnya di sini: Membuat dan berbagi dasbor di portal Microsoft Azure.
Peringatan Azure Monitor
Anda juga bisa menyiapkan pemberitahuan Azure Monitor yang akan memicu saat nilai metrik atau hasil kueri memenuhi kondisi tertentu. Sebagai contoh, mari kita buat peringatan untuk mengirim email ketika satu atau beberapa simpul belum mengirim detak jantung dalam 5 jam (yaitu diduga tidak tersedia).
Dari Log, jalankan kueri sampel Komputer yang tidak tersedia dengan memilih Jalankan pada kueri itu, seperti yang diperlihatkan di bawah ini.
Jika semua simpul tersedia, kueri ini harus mengembalikan hasil nol untuk saat ini. Klik Aturan pemberitahuan baru untuk mulai mengonfigurasi pemberitahuan Anda untuk kueri ini.
Ada tiga komponen untuk peringatan: sumber daya untuk membuat aturan (ruang kerja Analitik Log dalam hal ini), kondisi untuk memicu peringatan, dan grup tindakan yang menentukan apa yang akan terjadi saat peringatan dipicu. Klik judul kondisi, seperti yang ditunjukkan di bawah ini, untuk menyelesaikan konfigurasi logika sinyal.
Ini akan membuka Konfigurasikan logika sinyal.
Set bagian Logika peringatan sebagai berikut:
Berdasarkan: Jumlah hasil, Kondisi: Lebih besar dari, Ambang Batas: 0.
Karena kueri ini hanya mengembalikan simpul yang tidak tersedia sebagai hasil, jika jumlah hasilnya lebih besar dari 0, peringatan harus diaktifkan.
Di bagian Dievaluasi berdasarkan bagian, atur periode dan frekuensi berdasarkan seberapa sering Anda ingin memeriksa simpul yang tidak tersedia.
Untuk tujuan peringatan ini, Anda ingin memastikan Period=Frequency. Informasi selengkapnya tentang periode, frekuensi, dan parameter peringatan lainnya dapat ditemukan di sini.
Pilih Selesai saat Anda selesai mengonfigurasi logika sinyal.
Jika Anda belum memiliki grup tindakan yang sudah ada, klik Buat Baru dari bagian Grup Tindakan.
Ini akan membuka Tambahkan grup tindakan. Pilih Nama grup tindakan, Nama pendek, Langganan, dan Grup sumber daya. Di bawah bagian Tindakan, pilih Nama Tindakan dan pilih Email/SMS/Push/Suara sebagai Jenis Tindakan.
Catatan
Ada beberapa tindakan lain yang dapat memicu peringatan selain Email/SMS/Push/Voice, seperti Fungsi Azure, LogicApp, Webhook, ITSM, dan Automation Runbook. Pelajari lebih lanjut.
Ini akan membuka Email/SMS/Push/Voice. Pilih Nama untuk penerima, centang kotak Email, dan ketik alamat email yang ingin Anda kirimi pemberitahuan. Pilih OK di Email/SMS/Push/Voice, lalu Tambahkan grup tindakan untuk menyelesaikan konfigurasi grup tindakan Anda.
Setelah bilah ini ditutup, Anda akan melihat grup tindakan Anda tercantum di bawah bagian Grup Tindakan. Terakhir, lengkapi bagian Detail Pemberitahuan dengan mengetikkan Nama dan Deskripsi Aturan Pemberitahuan dan pilih Tingkat Keparahan. Klik Buat Aturan Pemberitahuan untuk menyelesaikan.
Tip
Kemampuan untuk menentukan Tingkat Keparahan adalah alat canggih yang dapat digunakan saat membuat beberapa peringatan. Misalnya, Anda dapat membuat satu pemberitahuan untuk menaikkan Peringatan (tingkat keparahan 1) jika satu simpul kepala turun dan pemberitahuan lain yang meningkatkan Kritis (tingkat keparahan 1) jika kedua node kepala tidak berfungsi.
Saat kondisi untuk pemberitahuan ini terpenuhi, peringatan akan muncul dan Anda akan menerima email dengan detail peringatan seperti ini:
Anda juga dapat menampilkan semua peringatan yang telah diaktifkan, dikelompokkan menurut tingkat keparahan, dengan membuka Peringatan di Ruang Kerja Analitik Log Anda.
Saat Anda memilih pada grup tingkat keparahan (yaitu tingkat keparahan 1, seperti yang disorot di atas) itu akan menampilkan rekaman untuk semua pemberitahuan tingkat keparahan yang telah diaktifkan seperti di bawah ini: