Terminologi Microsoft Fabric
Pelajari definisi istilah yang digunakan dalam Microsoft Fabric, termasuk istilah khusus untuk Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory, dan Power BI.
Istilah umum
kapasitas : kapasitas adalah sekumpulan sumber daya khusus yang tersedia pada waktu tertentu untuk digunakan. Kapasitas mendefinisikan kemampuan sumber daya untuk melakukan aktivitas atau menghasilkan output. Item yang berbeda mengonsumsi kapasitas yang berbeda pada waktu tertentu. Fabric menawarkan kapasitas melalui Fabric SKU dan Trials. Untuk informasi selengkapnya, lihat Apa itu kapasitas?
Experience: Kumpulan kemampuan yang ditargetkan ke fungsionalitas tertentu. Pengalaman Fabric termasuk Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory, dan Power BI.
Item: Item adalah serangkaian kemampuan dalam pengalaman. Pengguna dapat membuat, mengedit, dan menghapusnya. Setiap jenis item menyediakan kemampuan yang berbeda. Misalnya, pengalaman Rekayasa Data mencakup definisi tugas untuk lakehouse, notebook, dan Spark.
Penyewa: Penyewa adalah satu instans Fabric untuk organisasi dan selaras dengan ID Microsoft Entra.
Ruang Kerja: Ruang kerja adalah kumpulan item yang menyandingkan fungsionalitas yang berbeda dalam satu lingkungan yang dirancang untuk kolaborasi. Ini bertindak sebagai kontainer yang menggunakan kapasitas untuk pekerjaan yang dijalankan, dan menyediakan kontrol untuk siapa yang dapat mengakses item di dalamnya. Misalnya, di ruang kerja, pengguna membuat laporan, notebook, model semantik, dll. Untuk informasi selengkapnya, lihat artikel Ruang Kerja.
Rekayasa Data Jaringan
Lakehouse: Lakehouse adalah kumpulan file, folder, dan tabel yang mewakili database melalui data lake yang digunakan oleh mesin Apache Spark dan mesin SQL untuk pemrosesan big data. Lakehouse mencakup kemampuan yang ditingkatkan untuk transaksi ACID saat menggunakan tabel berformat Delta yang bersifat sumber terbuka. Item dari lakehouse dihosting dalam folder unik di ruang kerja di Microsoft OneLake. Ini berisi file dalam berbagai format (terstruktur dan tidak terstruktur) yang diatur dalam folder dan subfolder. Untuk informasi selengkapnya, lihat Apa itu lakehouse?
Notebook: buku catatan A Fabric adalah alat pemrograman interaktif multibahasa dengan fungsi yang kaya. Yang mencakup penulisan kode dan markdown, menjalankan dan memantau pekerjaan Spark, melihat dan memvisualisasikan hasil, dan berkolaborasi dengan tim. Ini membantu teknisi data dan ilmuwan data untuk menjelajahi dan memproses data, dan membangun eksperimen pembelajaran mesin dengan kode dan pengalaman kode rendah. Ini dapat dengan mudah diubah menjadi aktivitas alur untuk orkestrasi.
aplikasi Spark: Aplikasi Apache Spark adalah program yang ditulis oleh pengguna menggunakan salah satu bahasa API Spark (Scala, Python, Spark SQL, atau Java) atau bahasa yang ditambahkan Microsoft (.NET dengan C# atau F#). Saat aplikasi berjalan, aplikasi dibagi menjadi satu atau beberapa pekerjaan Spark yang berjalan secara paralel untuk memproses data lebih cepat. Untuk informasi selengkapnya, lihat pemantauan aplikasi Spark.
tugas Apache Spark: Tugas Spark adalah bagian dari aplikasi Spark yang dijalankan secara paralel dengan tugas-tugas lain dalam aplikasi tersebut. Pekerjaan terdiri dari beberapa tugas. Untuk informasi selengkapnya, lihat pemantauan pekerjaan Spark .
definisi kerja Apache Spark: Definisi kerja Spark adalah sekumpulan parameter, yang ditetapkan oleh pengguna, menunjukkan bagaimana aplikasi Spark harus dijalankan. Ini memungkinkan Anda untuk mengirimkan pekerjaan batch atau streaming ke kluster Spark. Untuk informasi selengkapnya, lihat Apa itu definisi kerja Apache Spark?
V-order: Optimasi penulisan ke dalam format file parquet yang memungkinkan pembacaan cepat serta memberikan efisiensi biaya dan kinerja yang lebih baik. Semua engine Fabric secara default menulis file parquet yang diurutkan menurut v.
Data Factory
Connector: Data Factory menawarkan sekumpulan konektor kaya yang memungkinkan Anda terhubung ke berbagai jenis penyimpanan data. Setelah tersambung, Anda dapat mengubah data. Untuk informasi selengkapnya, lihat konektor .
Alur data: Di Data Factory, alur data digunakan untuk mengatur pergerakan dan transformasi data. Alur ini berbeda dari alur penyebaran di Fabric. Untuk informasi selengkapnya, lihat Alur di gambaran umum Data Factory.
Dataflow Gen2: Dataflows menyediakan antarmuka kode rendah untuk menyerap data dari ratusan sumber data dan mengubah data Anda. Aliran data dalam Fabric disebut sebagai Dataflow Gen2. Aliran Data Gen1 ada di Power BI. Dataflow Gen2 menawarkan kemampuan tambahan dibandingkan dengan Aliran Data di Azure Data Factory atau Power BI. Anda tidak dapat meningkatkan dari Gen1 ke Gen2. Untuk informasi selengkapnya, lihat Aliran Data di bagian gambaran umum Data Factory.
pemicu : Kemampuan otomatisasi di Data Factory yang memulai alur berdasarkan kondisi tertentu, seperti jadwal atau ketersediaan data.
Fabric Data Science
Data Wrangler: Data Wrangler adalah alat berbasis notebook yang memberi pengguna pengalaman imersif untuk melakukan analisis data eksploratif. Fitur ini menggabungkan tampilan data seperti kisi dengan statistik ringkasan dinamis dan serangkaian operasi pembersihan data umum, semuanya tersedia dengan beberapa ikon yang dipilih. Setiap operasi menghasilkan kode yang dapat disimpan kembali ke buku catatan sebagai skrip yang dapat digunakan kembali.
eksperimen : Eksperimen pembelajaran mesin adalah unit utama organisasi dan kontrol untuk semua eksekusi pembelajaran mesin terkait. Untuk informasi selengkapnya, lihat eksperimen pembelajaran mesin di Microsoft Fabric.
Model : Model pembelajaran mesin adalah file yang dilatih untuk mengenali jenis pola tertentu. Anda melatih model melalui sekumpulan data, dan Anda menyediakannya dengan algoritma yang digunakannya untuk menjelaskan dan belajar dari himpunan data tersebut. Untuk informasi selengkapnya, lihat model pembelajaran mesin .
Pelaksanaan: Satu pelaksanaan merujuk pada satu eksekusi kode model. Dalam MLflow, pelacakan didasarkan pada eksperimen dan percobaan.
Gudang Data Fabric
titik akhir analitik SQL: Setiap Lakehouse memiliki titik akhir analitik SQL yang memungkinkan pengguna untuk mengkueri data tabel delta dengan TSQL melalui TDS. Untuk informasi selengkapnya, lihat titik akhir analitik SQL.
Fabric Data Warehouse: The Fabric Data Warehouse berfungsi sebagai gudang data tradisional dan mendukung kemampuan T-SQL transaksi lengkap yang Anda harapkan dari gudang data perusahaan. Untuk informasi selengkapnya, lihat Fabric Data Warehouse.
Kecerdasan Real-Time
Activator: Activator adalah alat tanpa kode dan kode rendah yang memungkinkan Anda membuat pemberitahuan, pemicu, dan tindakan pada data Anda. Aktivator digunakan untuk membuat pemberitahuan di aliran data Anda. Untuk informasi selengkapnya, lihat Aktivator.
Eventhouse: Eventhouses menyediakan solusi untuk menangani dan menganalisis data dalam volume besar, terutama dalam skenario yang membutuhkan analitik dan eksplorasi real time. Mereka dirancang untuk menangani aliran data real-time secara efisien, yang memungkinkan organisasi menyerap, memproses, dan menganalisis data hampir secara real time. Satu ruang kerja dapat menyimpan beberapa Eventhouse, eventhouse dapat menyimpan beberapa database KQL, dan setiap database dapat menyimpan beberapa tabel. Untuk informasi selengkapnya, lihat gambaran umum Eventhouse.
Eventstream: Fitur eventstream Microsoft Fabric menyediakan pusat terpusat di platform Fabric untuk menangkap, mengubah, dan mengarahkan peristiwa real-time ke tujuan dengan pengalaman tanpa kode. Eventstream terdiri dari berbagai sumber data streaming, tujuan penyerapan, dan prosesor peristiwa saat transformasi diperlukan. Untuk informasi selengkapnya, lihat Microsoft Fabric eventstreams.
KQL Database: KQL Database menyimpan data dalam format yang dapat Anda jalankan kueri KQL. Database KQL adalah elemen di bawah Eventhouse. Untuk informasi selengkapnya, lihat database KQL .
KQL Queryset: KQL Queryset adalah item yang digunakan untuk menjalankan kueri, menampilkan hasil, dan memanipulasi hasil kueri pada data dari database Data Explorer Anda. Kumpulan kueri mencakup basis data dan tabel, kueri-kueri, dan hasilnya. Set Kueri KQL memungkinkan Anda menyimpan kueri untuk digunakan di masa mendatang, atau mengekspor dan berbagi kueri dengan orang lain. Untuk informasi selengkapnya, lihat data Kueri di Set Kueri KQL
hub Real-Time
- hub Real-Time: hub Real-Time adalah satu-satunya tempat untuk semua data bergerak di seluruh organisasi Anda. Setiap tenant Microsoft Fabric secara otomatis dilengkapi dengan hub. Untuk informasi selengkapnya, lihat gambaran umum hub Real-Time.
OneLake
- Pintasan : Pintasan adalah referensi yang disematkan dalam OneLake yang menunjuk ke lokasi penyimpanan file lainnya. Mereka menyediakan cara untuk terhubung ke data yang ada tanpa harus langsung menyalinnya. Untuk informasi lebih lanjut, lihat pintasan OneLake .