Apa itu lakehouse di Microsoft Fabric?
Microsoft Fabric Lakehouse adalah platform arsitektur data untuk menyimpan, mengelola, dan menganalisis data terstruktur dan tidak terstruktur dalam satu lokasi. Ini adalah solusi fleksibel dan dapat diskalakan yang memungkinkan organisasi menangani data dalam volume besar menggunakan berbagai alat dan kerangka kerja untuk memproses dan menganalisis data tersebut. Ini terintegrasi dengan alat manajemen data dan analitik lainnya untuk memberikan solusi komprehensif untuk rekayasa dan analitik data. Lakehouse menggabungkan skalabilitas data lake dengan performa dan struktur gudang data, menyediakan platform terpadu untuk penyimpanan data, manajemen, dan analitik.
Titik akhir analisis SQL Lakehouse
Lakehouse membuat lapisan penyajian dengan secara otomatis menghasilkan titik akhir analitik SQL dan model semantik default selama pembuatan. Fungsionalitas see-through baru ini memungkinkan pengguna untuk bekerja langsung di atas tabel Delta di danau untuk memberikan pengalaman tanpa gesekan dan berkinerja dari penyerapan data hingga pelaporan.
Penting untuk dicatat bahwa titik akhir analitik SQL adalah pengalaman baca-saja dan tidak mendukung area permukaan T-SQL penuh dari gudang data transaksi.
Nota
Hanya tabel dalam format Delta yang tersedia di titik akhir analitik SQL. Parquet, CSV, dan format lainnya tidak dapat dikueri menggunakan titik akhir analitik SQL. Jika Anda tidak melihat tabel, Anda harus mengonversinya ke format Delta.
Penemuan dan pendaftaran tabel otomatis
Penemuan dan pendaftaran tabel otomatis adalah fitur dari Lakehouse yang menyediakan pengalaman integrasi file ke tabel yang sepenuhnya terkelola bagi insinyur data dan ilmuwan data. Anda dapat meletakkan file ke area terkelola Lakehouse dan sistem secara otomatis memvalidasinya untuk format terstruktur yang didukung, dan mendaftarkannya ke metastore dengan metadata yang diperlukan seperti nama kolom, format, kompresi, dan banyak lagi. (Saat ini satu-satunya format yang didukung adalah tabel Delta.) Anda kemudian dapat mereferensikan file sebagai tabel dan menggunakan sintaks SparkSQL untuk berinteraksi dengan data.
Berinteraksi dengan elemen Lakehouse
Insinyur data dapat berinteraksi dengan lakehouse dan data di dalam lakehouse dengan berbagai cara:
penjelajah Lakehouse: Penjelajah adalah halaman utama untuk berinteraksi dengan Lakehouse. Anda dapat memuat data di Lakehouse Anda, menjelajahi data di Lakehouse menggunakan penjelajah objek, mengatur label MIP & berbagai hal lainnya. Pelajari selengkapnya tentang pengalaman penjelajah: Navigasikan penjelajah Fabric Lakehouse.
Notebooks: Insinyur data dapat menggunakan notebook untuk menulis kode guna membaca, mengubah, dan menulis langsung ke Lakehouse sebagai tabel dan/atau folder. Anda bisa mempelajari selengkapnya tentang cara menggunakan buku catatan untuk Lakehouse: Menjelajahi data di lakehouse Anda dengan buku catatan dan Cara menggunakan buku catatan untuk memuat data ke lakehouse Anda.
Pipelines: Teknisi data dapat menggunakan alat integrasi data seperti alat salinan alur untuk menarik data dari sumber lain dan mendarat ke Lakehouse. Temukan informasi selengkapnya tentang cara menggunakan aktivitas salin: Cara menyalin data menggunakan aktivitas salin.
definisi kerja Apache Spark: Teknisi data dapat mengembangkan aplikasi yang kuat dan mengatur eksekusi pekerjaan Spark yang dikompilasi di Java, Scala, dan Python. Pelajari selengkapnya tentang pekerjaan Spark: Apa itu definisi kerja Apache Spark?
Dataflows Gen 2: Teknisi data dapat menggunakan Aliran Data Gen 2 untuk menyerap dan menyiapkan data mereka. Temukan informasi selengkapnya tentang memuat data menggunakan aliran data: Buat aliran data pertama Anda untuk mendapatkan dan mengubah data.
Pelajari selengkapnya tentang berbagai cara untuk memuat data ke lakehouse Anda: opsi untuk mendapatkan data ke Fabric Lakehouse.
Menjalankan banyak tugas dengan arsitektur lakehouse
Pengalaman multitugas menyediakan desain tab browser yang memungkinkan Anda membuka dan beralih di antara beberapa item dengan mulus memungkinkan Anda mengelola data lakehouse Anda lebih efisien dari sebelumnya. Tidak perlu lagi bolak-balik antara jendela yang berbeda atau kehilangan fokus pada tugas Anda. Lakehouse memberikan pengalaman multitugas yang ditingkatkan untuk membuat perjalanan manajemen data Anda seefisien dan ramah pengguna dengan kemampuan berikut:
Mempertahankan operasi yang sedang berjalan: Anda dapat mengunggah atau menjalankan operasi pemuatan data dalam satu tab dan memeriksa tugas lain di tab yang berbeda. Dengan multi-tugas yang disempurnakan, operasi yang sedang berjalan tidak dibatalkan saat Anda menavigasi antar tab. Anda dapat fokus pada pekerjaan Anda tanpa gangguan.
Pertahankan konteks Anda: Objek, tabel data, atau file yang dipilih tetap terbuka dan tersedia saat Anda beralih antar tab. Konteks data lakehouse Anda selalu ada di ujung jari Anda.
Muat Ulang Daftar Non-Penghalang: Mekanisme muat ulang tanpa penghalang untuk daftar file dan tabel Anda. Anda bisa terus bekerja sementara daftar diperbarui di latar belakang. Ini memastikan bahwa Anda memiliki data terbaru sambil memberi Anda pengalaman yang lancar dan tidak terganggu.
Pemberitahuan yang ditentukan dengan jelas: Notifikasi singkat menunjukkan dari lakehouse mana asalnya, sehingga memudahkan pelacakan perubahan dan pembaruan dalam lingkungan multi-tugas Anda.
Desain lakehouse yang dapat diakses
Aksesibilitas selalu menjadi prioritas utama untuk memastikan bahwa Lakehouse inklusif dan ramah pengguna untuk semua orang. Berikut adalah inisiatif utama yang telah kami terapkan sejauh ini untuk mendukung aksesibilitas:
Kompatibilitas pembaca layar: Anda dapat bekerja dengan lancar dengan pembaca layar populer, memungkinkan pengguna yang terganggu secara visual untuk menavigasi dan berinteraksi dengan platform kami secara efektif.
Pengaliran ulang teks desain responsif yang beradaptasi dengan ukuran dan orientasi layar yang berbeda. Teks dan konten reflow secara dinamis, sehingga memudahkan pengguna untuk melihat dan berinteraksi dengan aplikasi kami di berbagai perangkat.
Navigasi keyboard: Peningkatan navigasi keyboard sehingga pengguna dapat bergerak melalui lakehouse tanpa harus bergantung pada mouse, meningkatkan pengalaman bagi mereka yang memiliki disabilitas motorik.
Teks alternatif untuk gambar: Semua gambar sekarang menyertakan teks alt deskriptif, sehingga memungkinkan pembaca layar untuk menyampaikan informasi yang bermakna.
Bidang formulir dan Label: Semua bidang formulir memiliki label terkait, menyederhanakan input data untuk semua orang, termasuk yang menggunakan pembaca layar.
Konten terkait
Dalam gambaran umum ini, Anda mendapatkan pemahaman dasar tentang rumah danau. Lanjutkan ke artikel berikutnya untuk mempelajari cara membuat dan menggunakan lakehouse Anda sendiri:
- Untuk mulai menggunakan lakehouse, lihat Membuat lakehouse di Microsoft Fabric.