Apa itu tautan semantik?
Tautan semantik adalah fitur yang memungkinkan Anda membuat koneksi antara model semantik dan Ilmu Data Synapse di Microsoft Fabric. Penggunaan tautan semantik hanya didukung di Microsoft Fabric.
Untuk Spark 3.4 ke atas, tautan semantik tersedia dalam runtime default saat menggunakan Fabric, dan tidak perlu menginstalnya.
Untuk Spark 3.3 atau di bawahnya, atau untuk memperbarui ke versi terbaru tautan semantik, jalankan perintah berikut:
%pip install -U semantic-link
Tujuan utama tautan semantik adalah untuk:
- Memfasilitasi konektivitas data.
- Aktifkan penyebaran informasi semantik.
- Integrasikan dengan mulus dengan alat yang digunakan ilmuwan data yang mapan, seperti notebook.
Tautan semantik membantu Anda mempertahankan pengetahuan domain tentang semantik data dengan cara standar yang dapat mempercepat analisis data dan mengurangi kesalahan.
Aliran data tautan semantik
Aliran data tautan semantik dimulai dengan model semantik yang berisi data dan informasi semantik. Tautan semantik menjelajah kesenjangan antara Power BI dan pengalaman Ilmu Data Synapse.
Tautan semantik memungkinkan Anda menggunakan model semantik dari Power BI dalam pengalaman Ilmu Data Synapse untuk melakukan tugas seperti analisis statistik mendalam dan pemodelan prediktif dengan teknik pembelajaran mesin. Anda dapat menyimpan output pekerjaan ilmu data Anda ke OneLake dengan menggunakan Apache Spark, dan menyerap output yang disimpan ke Power BI dengan menggunakan Direct Lake.
konektivitas Power BI
Model semantik berfungsi sebagai model objek tabular tunggal yang menyediakan sumber yang andal untuk definisi semantik seperti pengukuran Power BI. Tautan semantik terhubung ke model semantik dalam ekosistem berikut, sehingga memudahkan ilmuwan data untuk bekerja dalam sistem yang paling mereka kenal.
- Ekosistem panda python, melalui pustaka SemPy Python.
- Ekosistem Apache Spark , melalui konektor asli Spark. Implementasi ini mendukung berbagai bahasa, termasuk PySpark, Spark SQL, R, dan Scala.
Aplikasi informasi semantik
Informasi semantik dalam data menyertakan kategori data Power BI seperti alamat dan kode pos, hubungan antara tabel, dan informasi hierarkis.
Kategori data ini terdiri dari metadata yang disebarkan tautan semantik ke lingkungan Synapse Ilmu Data untuk memungkinkan pengalaman baru dan memelihara silsilah data.
Beberapa contoh aplikasi tautan semantik meliputi:
- Saran cerdas tentang fungsi semantik bawaan.
- Integrasi inovatif untuk menambah data dengan pengukuran Power BI, dengan menggunakan add-measures.
- Alat untuk validasi kualitas data berdasarkan hubungan antara tabel dan dependensi fungsional dalam tabel.
Tautan semantik adalah alat canggih yang memungkinkan analis bisnis menggunakan data secara efektif dalam lingkungan ilmu data yang komprehensif.
Tautan semantik memfasilitasi kolaborasi yang mulus antara ilmuwan data dan analis bisnis dengan menghilangkan kebutuhan untuk melengkapi logika bisnis yang disematkan dalam langkah-langkah Power BI. Pendekatan ini memastikan bahwa kedua belah pihak dapat bekerja secara efisien dan produktif, memaksimalkan potensi wawasan berbasis data mereka.
Struktur data FabricDataFrame
FabricDataFrame adalah struktur data utama yang digunakan tautan semantik untuk menyebarluaskan informasi semantik dari model semantik ke lingkungan Synapse Ilmu Data.
Kelas FabricDataFrame
:
- Mendukung semua operasi panda.
- Subkelas dataframe pandas dan menambahkan metadata, seperti informasi semantik dan silsilah data.
- Mengekspos fungsi semantik dan metode add-measure yang memungkinkan Anda menggunakan pengukuran Power BI dalam pekerjaan ilmu data.
Konten terkait
- Jelajahi dokumentasi referensi untuk paket tautan semantik Python (SemPy)
- Tutorial: Membersihkan data dengan dependensi fungsi
- Konektivitas Power BI dengan tautan semantik dan Microsoft Fabric
- Menjelajahi dan memvalidasi data dengan menggunakan tautan semantik
- Menjelajahi dan memvalidasi hubungan dalam model semantik