Apa itu pergudangan data di Microsoft Fabric?
Berlaku untuk:✅ Titik akhir analitik SQL dan Gudang di Microsoft Fabric
Fabric Data Warehouse adalah solusi pergudangan data generasi berikutnya dalam Microsoft Fabric.
Gudang yang ber sentris danau dibangun di atas mesin pemrosesan terdistribusi tingkat perusahaan yang memungkinkan performa industri terkemuka dalam skala besar sambil meminimalkan kebutuhan akan konfigurasi dan manajemen. Tinggal di data lake dan dirancang untuk secara asli mendukung format data terbuka, gudang data Fabric memungkinkan kolaborasi yang mulus antara teknisi data dan pengguna bisnis tanpa mengorbankan keamanan atau tata kelola.
Pengalaman SaaS yang mudah digunakan juga terintegrasi erat dengan Power BI untuk analisis dan pelaporan yang mudah, menggabungkan dunia data lake dan gudang dan sangat menyederhanakan investasi organisasi di properti analitik mereka.
Pelanggan gudang data mendapat manfaat dari:
- Data yang disimpan dalam format Delta-parquet memungkinkan transaksi ACID dan interoperabilitas dengan beban kerja Fabric lainnya berarti Anda tidak memerlukan beberapa salinan data.
- Kueri lintas database dapat menggunakan beberapa sumber data untuk wawasan cepat dengan duplikasi data nol.
- Dengan mudah menyerap, memuat, dan mengubah data dalam skala besar melalui Alur, Aliran Data, kueri lintas database, atau perintah COPY INTO.
- Manajemen beban kerja otonom dengan mesin pemrosesan kueri terdistribusi terkemuka di industri berarti tidak ada kenop untuk beralih untuk mencapai performa terbaik di kelasnya.
- Skalakan hampir secara instan untuk memenuhi tuntutan bisnis. Penyimpanan dan komputasi dipisahkan.
- Mengurangi waktu untuk wawasan dengan model semantik yang mudah dikonsumsi dan selalu terhubung yang terintegrasi dengan Power BI dalam mode Direct Lake. Laporan selalu memiliki data terbaru untuk analisis dan pelaporan.
- Dibangun untuk tingkat keterampilan apa pun, dari pengembang warga hingga DBA atau insinyur data.
Item pergudangan data
Fabric Data Warehouse bukan gudang data perusahaan tradisional, ini adalah gudang lake yang mendukung dua item pergudangan yang berbeda: gudang data Fabric dan titik akhir analitik SQL. Keduanya dibuat khusus untuk memenuhi kebutuhan bisnis pelanggan sekaligus memberikan performa terbaik di kelasnya, meminimalkan biaya, dan mengurangi overhead administratif.
Gudang Data Fabric
Di ruang kerja Microsoft Fabric, gudang Fabric diberi label sebagai Gudang di kolom Jenis . Ketika Anda membutuhkan kemampuan daya dan transaksi penuh (dukungan kueri DDL dan DML) dari gudang data, ini adalah solusi cepat dan sederhana untuk Anda.
Gudang dapat diisi oleh salah satu metode penyerapan data yang didukung seperti COPY INTO, Pipelines, Dataflows, atau opsi penyerapan lintas database seperti CREATE TABLE AS SELECT (CTAS), INSERT.. SELECT, atau SELECT INTO.
Untuk mulai menggunakan Gudang, lihat:
Titik akhir analitik SQL dari Lakehouse
Di ruang kerja Microsoft Fabric, setiap Lakehouse memiliki "titik akhir analitik SQL" yang dibuat secara otomatis yang dapat digunakan untuk transisi dari tampilan "Lake" Lakehouse (yang mendukung rekayasa data dan Apache Spark) ke tampilan "SQL" dari Lakehouse yang sama untuk membuat tampilan, fungsi, prosedur tersimpan, dan menerapkan keamanan SQL.
Dengan titik akhir analitik SQL lakehouse, perintah T-SQL dapat menentukan dan mengkueri objek data tetapi tidak memanipulasi atau memodifikasi data. Anda dapat melakukan tindakan berikut di titik akhir analitik SQL:
- Kueri tabel yang mereferensikan data di folder Delta Lake Anda di lake.
- Buat tampilan, TVF sebaris, dan prosedur untuk merangkum semantik dan logika bisnis Anda di T-SQL.
- Mengelola izin pada objek.
Untuk mulai menggunakan titik akhir analitik SQL, lihat:
- Lebih baik bersama: lakehouse dan gudang di Microsoft Fabric
- Pertimbangan performa titik akhir analitik SQL
- Mengkueri titik akhir analitik SQL atau Gudang di Microsoft Fabric
Gudang atau lakehouse
Saat memutuskan antara menggunakan gudang atau lakehouse, penting untuk mempertimbangkan kebutuhan dan konteks spesifik persyaratan manajemen data dan analitik Anda. Sama pentingnya, ini bukan keputusan satu arah!
Anda selalu memiliki kesempatan untuk menambahkan satu atau yang lain di titik selanjutnya jika bisnis Anda perlu berubah dan terlepas dari di mana Anda memulai, baik gudang maupun lakehouse menggunakan mesin SQL yang kuat yang sama untuk semua kueri T-SQL.
Berikut adalah beberapa panduan umum untuk membantu Anda membuat keputusan:
Pilih gudang data saat Anda memerlukan solusi skala perusahaan dengan format standar terbuka, tanpa performa kenop, dan penyiapan minimal. Paling cocok untuk format data semi terstruktur dan terstruktur, gudang data cocok untuk profesional data pemula dan berpengalaman, menawarkan pengalaman sederhana dan intuitif.
Pilih lakehouse ketika Anda membutuhkan repositori besar data yang sangat tidak terstruktur dari sumber heterogen, memanfaatkan penyimpanan objek berbiaya rendah dan ingin menggunakan SPARK sebagai alat pengembangan utama Anda. Bertindak sebagai gudang data 'ringan', Anda selalu memiliki opsi untuk menggunakan titik akhir SQL dan alat T-SQL untuk memberikan skenario pelaporan dan inteligensi data di lakehouse Anda.
Untuk panduan keputusan yang lebih rinci, lihat Panduan keputusan Microsoft Fabric: Pilih antara Gudang dan Lakehouse.