Menyiapkan klaster HDInsight dengan Ambari DB kustom
Apache Ambari menyederhanakan manajemen dan pemantauan klaster Apache Hadoop. Ambari menyediakan antarmuka pengguna web dan REST API yang mudah digunakan. Ambari disertakan pada kluster HDInsight, dan digunakan untuk memantau kluster dan membuat perubahan konfigurasi.
Dalam pembuatan kluster normal, seperti yang dijelaskan dalam artikel lain seperti Menyiapkan kluster di HDInsight, Ambari disebarkan dalam S0 Azure SQL Database yang dikelola oleh HDInsight dan tidak dapat diakses oleh pengguna.
Fitur Ambari DB kustom memungkinkan Anda untuk menyebarkan klaster baru dan mengatur Ambari dalam database eksternal yang Anda kelola. Penyebaran dilakukan dengan templat Azure Resource Manager. Fitur ini memiliki manfaat sebagai berikut:
- Kustomisasi - Anda memilih ukuran dan kapasitas pemrosesan database. Jika Anda memiliki klaster besar yang memproses beban kerja intensif, database Ambari dengan spesifikasi yang lebih rendah bisa menjadi hambatan untuk operasi manajemen.
- Fleksibilitas - Anda dapat menskalakan database dengan kebutuhan Anda.
- Kontrol - Anda dapat mengelola cadangan dan keamanan untuk database Anda dengan cara yang sesuai dengan kebutuhan organisasi Anda.
Sisa artikel ini membahas hal-hal berikut:
- persyaratan untuk menggunakan fitur Ambari DB kustom
- langkah-langkah yang diperlukan untuk memprovisikan kluster HDInsight menggunakan database eksternal Anda sendiri untuk Apache Ambari
Persyaratan Ambari DB kustom
Anda dapat menyebarkan Ambari DB kustom dengan semua jenis dan versi klaster. Beberapa kluster tidak dapat menggunakan Ambari DB yang sama.
Ambari DB kustom memiliki persyaratan lain sebagai berikut:
- Nama database tidak boleh berisi tanda hubung atau spasi
- Anda harus memiliki database dan server Azure SQL DB yang sudah ada.
- Database yang Anda sediakan untuk penyiapan Ambari harus kosong. Seharusnya tidak ada tabel dalam skema dbo default.
- Pengguna yang digunakan untuk menyambungkan ke database harus memiliki izin SELECT, CREATE TABLE, INSERT, UPDATE, DELETE, ALTER ON SCHEMA dan REFERENCES ON SCHEMA pada database.
GRANT CREATE TABLE TO newuser;
GRANT INSERT TO newuser;
GRANT SELECT TO newuser;
GRANT UPDATE TO newuser;
GRANT DELETE TO newuser;
GRANT ALTER ON SCHEMA::dbo TO newuser;
GRANT REFERENCES ON SCHEMA::dbo TO newuser;
- Aktifkan opsi untuk Mengizinkan akses ke layanan Azure di server tempat Anda menghosting Ambari.
- Alamat IP manajemen dari layanan HDInsight harus diperbolehkan dalam aturan firewall. Lihat Alamat IP manajemen HDInsight untuk daftar alamat IP yang harus ditambahkan ke aturan firewall tingkat server.
Saat Anda menghosting Apache Ambari DB Anda di database eksternal, ingat hal-hal berikut:
- Anda bertanggung jawab atas biaya tambahan Azure SQL DB yang menampung Ambari.
- Cadangkan Ambari DB kustom Anda secara berkala. Azure SQL Database menghasilkan cadangan secara otomatis, tetapi kerangka waktu penyimpanan cadangan bervariasi. Untuk informasi selengkapnya, lihat Mempelajari tentang pencadangan SQL Database otomatis.
- Jangan ubah kata sandi Ambari DB kustom setelah kluster HDInsight mencapai status Berjalan. Ini tidak didukung.
Catatan
Anda dapat menggunakan Identitas Terkelola untuk mengautentikasi dengan database SQL untuk Ambari. Untuk informasi selengkapnya, lihat Menggunakan Identitas Terkelola untuk autentikasi SQL Database di Azure HDInsight
Menyebarkan klaster dengan Ambari DB kustom
Untuk membuat klaster HDInsight yang menggunakan database Ambari eksternal Anda sendiri, gunakan templat Mulai Cepat Ambari DB kustom.
Edit parameter di azuredeploy.parameters.json
untuk menentukan informasi tentang kluster baru Anda dan database yang menyimpan Ambari.
Anda dapat memulai penyebaran menggunakan Azure CLI. Ganti <RESOURCEGROUPNAME>
dengan grup sumber daya tempat Anda ingin menyebarkan klaster Anda.
az deployment group create --name HDInsightAmbariDBDeployment \
--resource-group <RESOURCEGROUPNAME> \
--template-file azuredeploy.json \
--parameters azuredeploy.parameters.json
Peringatan
Gunakan komputer virtual SQL DB dan Headnode yang direkomendasikan berikut untuk kluster HDInsight Anda. Jangan gunakan Ambari DB (S0) default untuk lingkungan produksi apa pun.
Database dan Headnode sizing
Tabel berikut ini menyediakan panduan tingkat Azure SQL DB mana yang harus dipilih berdasarkan ukuran klaster HDInsight Anda.
Jumlah node pekerja | Tingkat DB yang diperlukan | Diperlukan mesin virtual Headnode |
---|---|---|
<=4 | S0 | 4 core/28 GB RAM atau lebih tinggi |
>4 && <=8 | S1 | 4 core/28 GB RAM atau lebih tinggi |
>8 && <=16 | S2 | 4 core/28 GB RAM atau lebih tinggi |
>16 && <=32 | S3 | 8 core/56 GB RAM atau lebih tinggi |
>32 && <=64 | S4 | 8 core/56 GB RAM atau lebih tinggi |
>64 && <=128 | P2 | 16 core/112 GB RAM atau lebih tinggi |
>128 | Hubungi Dukungan | Hubungi Dukungan |