Bagikan melalui


Bagaimana memantau ketersediaan kluster dengan log Azure Monitor di Microsoft Azure HDInsight

Kluster Microsoft Azure HDInsight mencakup integrasi log Azure Monitor, yang menyediakan metrik dan log yang dapat dikueri, serta peringatan yang dapat dikonfigurasi. Artikel ini memperlihatkan cara menggunakan Azure Monitor untuk memantau kluster Anda.

Integrasi log Azure Monitor

Log Azure Monitor memungkinkan data yang dihasilkan oleh beberapa sumber daya, seperti kluster Microsoft Azure HDInsight, untuk dikumpulkan dan dikumpulkan di satu tempat untuk mencapai pengalaman pemantauan terpadu.

Sebagai prasyarat, Anda memerlukan Ruang Kerja Analitik Log untuk menyimpan data yang dikumpulkan. Jika belum membuatnya, Anda dapat mengikuti petunjuk di sini: Buat Ruang Kerja Analitik Log.

Aktifkan integrasi log Microsoft Azure HDInsight Azure Monitor

Dari halaman sumber daya kluster Microsoft Azure HDInsight di portal, pilih Azure Monitor. Kemudian, pilih aktifkan dan pilih ruang kerja Analitik Log Anda dari turun bawah.

HDInsight Operations Management Suite.

Secara default, ini memasang agen OMS pada semua simpul kluster kecuali simpul tepi. Karena tidak ada agen OMS yang dipasang pada simpul tepi kluster, tidak ada telemetri pada simpul tepi yang ada di Log Analytics secara default.

Metrik kueri dan tabel log

Setelah integrasi log Azure Monitor diaktifkan (ini mungkin memakan waktu beberapa menit), arahkan ke sumber daya Ruang Kerja Analitik Log Anda dan pilih Log .

Log ruang kerja Analitik Log.

Log cantumkan sejumlah kueri sampel, seperti:

Nama kueri Deskripsi
Ketersediaan komputer hari ini Bagan jumlah komputer yang mengirim log, setiap jam
Camtumkan detak jantung Cantumkan semua detak jantung komputer dari satu jam terakhir
Detak jantung terakhir dari setiap komputer Tunjukkan detak jantung terakhir yang dikirim oleh setiap komputer
Komputer yang tidak tersedia Cantumkan semua komputer yang diketahui yang tidak mengirim detak jantung dalam 5 jam terakhir
Tingkat ketersediaan Hitung tingkat ketersediaan setiap komputer yang tersambung

Sebagai contoh, jalankan kueri sampel laju ketersediaan dengan memilih Jalankan pada kueri itu, seperti yang diperlihatkan dalam cuplikan layar di atas. Ini akan menunjukkan tingkat ketersediaan setiap simpul di kluster Anda sebagai persentase. Jika Anda telah mengaktifkan beberapa kluster Microsoft Azure HDInsight untuk mengirim metrik ke ruang kerja Analitik Log yang sama, Anda akan melihat tingkat ketersediaan untuk semua simpul (tidak termasuk simpul tepi) di kluster yang ditampilkan.

Kueri sampel 'tingkat ketersediaan' log ruang kerja Analitik Log.

Catatan

Tingkat ketersediaan diukur selama periode 24 jam, sehingga klusterster Anda harus berjalan setidaknya selama 24 jam sebelum Anda melihat tingkat ketersediaan yang akurat.

Anda dapat menyematkan tabel ini ke dasbor bersama dengan mengklik Sematkan di sudut kanan atas. Jika Anda tidak memiliki dasbor bersama yang dapat ditulis, Anda bisa melihat cara membuatnya di sini: Membuat dan berbagi dasbor di portal Microsoft Azure.

Peringatan Azure Monitor

Anda juga bisa menyiapkan pemberitahuan Azure Monitor yang akan memicu saat nilai metrik atau hasil kueri memenuhi kondisi tertentu. Sebagai contoh, mari kita buat peringatan untuk mengirim email ketika satu atau beberapa simpul belum mengirim detak jantung dalam 5 jam (yaitu diduga tidak tersedia).

Dari Log, jalankan kueri sampel Komputer yang tidak tersedia dengan memilih Jalankan pada kueri itu, seperti yang diperlihatkan di bawah ini.

Log ruang kerja Log Analytics mencatat sampel 'komputer yang tidak tersedia'.

Jika semua simpul tersedia, kueri ini harus mengembalikan hasil nol untuk saat ini. Klik Aturan pemberitahuan baru untuk mulai mengonfigurasi pemberitahuan Anda untuk kueri ini.

Aturan pemberitahuan baru ruang kerja Analitik Log.

Ada tiga komponen untuk peringatan: sumber daya untuk membuat aturan (ruang kerja Analitik Log dalam hal ini), kondisi untuk memicu peringatan, dan grup tindakan yang menentukan apa yang akan terjadi saat peringatan dipicu. Klik judul kondisi, seperti yang ditunjukkan di bawah ini, untuk menyelesaikan konfigurasi logika sinyal.

Pemberitahuan portal membuat kondisi aturan.

Ini akan membuka Konfigurasikan logika sinyal.

Set bagian Logika peringatan sebagai berikut:

Berdasarkan: Jumlah hasil, Kondisi: Lebih besar dari, Ambang Batas: 0.

Karena kueri ini hanya mengembalikan simpul yang tidak tersedia sebagai hasil, jika jumlah hasilnya lebih besar dari 0, peringatan harus diaktifkan.

Di bagian Dievaluasi berdasarkan bagian, atur periode dan frekuensi berdasarkan seberapa sering Anda ingin memeriksa simpul yang tidak tersedia.

Untuk tujuan peringatan ini, Anda ingin memastikan Period=Frequency. Informasi selengkapnya tentang periode, frekuensi, dan parameter peringatan lainnya dapat ditemukan di sini.

Pilih Selesai saat Anda selesai mengonfigurasi logika sinyal.

Aturan pemberitahuan mengonfigurasi logika sinyal.

Jika Anda belum memiliki grup tindakan yang sudah ada, klik Buat Baru dari bagian Grup Tindakan.

Aturan pemberitahuan membuat grup tindakan baru.

Ini akan membuka Tambahkan grup tindakan. Pilih Nama grup tindakan, Nama pendek, Langganan, dan Grup sumber daya. Di bawah bagian Tindakan, pilih Nama Tindakan dan pilih Email/SMS/Push/Suara sebagai Jenis Tindakan.

Catatan

Ada beberapa tindakan lain yang dapat memicu peringatan selain Email/SMS/Push/Voice, seperti Fungsi Azure, LogicApp, Webhook, ITSM, dan Automation Runbook. Pelajari lebih lanjut.

Ini akan membuka Email/SMS/Push/Voice. Pilih Nama untuk penerima, centang kotak Email, dan ketik alamat email yang ingin Anda kirimi pemberitahuan. Pilih OK di Email/SMS/Push/Voice, lalu Tambahkan grup tindakan untuk menyelesaikan konfigurasi grup tindakan Anda.

Aturan pemberitahuan membuat tambahkan grup tindakan.

Setelah bilah ini ditutup, Anda akan melihat grup tindakan Anda tercantum di bawah bagian Grup Tindakan. Terakhir, lengkapi bagian Detail Pemberitahuan dengan mengetikkan Nama dan Deskripsi Aturan Pemberitahuan dan pilih Tingkat Keparahan. Klik Buat Aturan Pemberitahuan untuk menyelesaikan.

Portal membuat aturan pemberitahuan selesai.

Tip

Kemampuan untuk menentukan Tingkat Keparahan adalah alat canggih yang dapat digunakan saat membuat beberapa peringatan. Misalnya, Anda dapat membuat satu pemberitahuan untuk menaikkan Peringatan (tingkat keparahan 1) jika satu simpul kepala turun dan pemberitahuan lain yang meningkatkan Kritis (tingkat keparahan 1) jika kedua node kepala tidak berfungsi.

Saat kondisi untuk pemberitahuan ini terpenuhi, peringatan akan muncul dan Anda akan menerima email dengan detail peringatan seperti ini:

Contoh email pemberitahuan Azure Monitor.

Anda juga dapat menampilkan semua peringatan yang telah diaktifkan, dikelompokkan menurut tingkat keparahan, dengan membuka Peringatan di Ruang Kerja Analitik Log Anda.

Pemberitahuan ruang kerja Analitik Log.

Saat Anda memilih pada grup tingkat keparahan (yaitu tingkat keparahan 1, seperti yang disorot di atas) itu akan menampilkan rekaman untuk semua pemberitahuan tingkat keparahan yang telah diaktifkan seperti di bawah ini:

Cuplikan layar memperlihatkan tingkat keparahan ruang kerja Analitik Log satu pemberitahuan.

Langkah berikutnya