Memigrasikan notebook dari Azure Synapse Analytics ke Fabric
Notebook dukungan Azure Synapse dan Fabric. Memigrasikan notebook dari Azure Synapse ke Fabric dapat dilakukan dengan dua cara berbeda:
- Opsi 1: Anda dapat mengekspor notebook dari Azure Synapse (.ipynb) dan mengimpornya ke Fabric (secara manual).
- Opsi 2: Anda dapat menggunakan skrip untuk mengekspor notebook dari Azure Synapse dan mengimpornya ke Fabric menggunakan API.
Untuk pertimbangan notebook, lihat perbedaan antara Azure Synapse Spark dan Fabric.
Prasyarat
Jika Anda belum memilikinya, buat ruang kerja Fabric di penyewa Anda.
Opsi 1: Mengekspor dan mengimpor notebook secara manual
Untuk mengekspor notebook dari Azure Synapse:
- Buka Synapse Studio: Masuk ke Azure. Navigasi ke ruang kerja Azure Synapse Anda dan buka Synapse Studio.
- Temukan buku catatan: Di Synapse Studio, temukan buku catatan yang ingin Anda ekspor dari bagian Buku Catatan ruang kerja Anda.
-
Ekspor buku catatan:
- Klik kanan pada buku catatan yang ingin Anda ekspor.
- Pilih Ekspor>Notebook (.ipynb).
- Pilih folder tujuan dan berikan nama untuk file buku catatan yang diekspor.
- Setelah ekspor selesai, Anda harus memiliki file notebook yang tersedia untuk diunggah.
Untuk mengimpor notebook yang diekspor di Fabric:
- Ruang kerja Access Fabric: Masuk ke Fabric dan akses ruang kerja Anda.
- Navigasi ke beranda Rekayasa Data: Setelah berada di dalam ruang kerja Fabric Anda, buka beranda Rekayasa Data.
-
Impor buku catatan:
- Pilih Impor buku catatan. Anda dapat mengimpor satu atau beberapa buku catatan yang sudah ada dari komputer lokal Anda ke ruang kerja Fabric.
- Telusuri file notebook .ipynb yang Anda unduh dari Azure Synapse Analytics.
- Pilih file buku catatan dan klik Unggah.
- Buka dan gunakan Notebook: Setelah impor selesai, Anda bisa membuka dan menggunakan notebook di ruang kerja Fabric Anda.
Setelah buku catatan diimpor, validasi dependensi notebook:
- Pastikan menggunakan versi Spark yang sama.
- Jika Anda menggunakan notebook yang direferensikan, Anda dapat menggunakan msparkutils juga di Fabric. Namun, jika Anda mengimpor buku catatan yang mereferensikan buku catatan lain, Anda juga perlu mengimpor yang terakhir. Ruang kerja Fabric tidak mendukung folder untuk saat ini, sehingga referensi apa pun ke notebook di folder lain harus diperbarui. Anda bisa menggunakan sumber daya buku catatan jika diperlukan.
- Jika buku catatan menggunakan pustaka dan konfigurasi khusus kumpulan, Anda juga perlu mengimpor pustaka dan/atau konfigurasi tersebut.
- Layanan tertaut, koneksi sumber data, dan titik pemasangan.
Opsi 2: Gunakan Fabric API
Ikuti langkah-langkah utama ini untuk migrasi:
- Prasyarat.
- Langkah 1: Ekspor notebook dari Azure Synapse ke OneLake (.ipynb).
- Langkah 2: Impor notebook secara otomatis ke Fabric menggunakan Fabric API.
Prasyarat
Prasyarat mencakup tindakan yang perlu Anda pertimbangkan sebelum memulai migrasi notebook ke Fabric.
- Ruang kerja Fabric.
- Jika Anda belum memilikinya, buat rumah danau Fabric di ruang kerja Anda.
Langkah 1: Mengekspor notebook dari ruang kerja Azure Synapse
Fokus Langkah 1 adalah mengekspor buku catatan dari ruang kerja Azure Synapse ke OneLake dalam format .ipynb. Proses ini adalah sebagai berikut:
- 1.1) Impor notebook migrasi ke ruang kerja Fabric . Buku catatan ini mengekspor semua buku catatan dari ruang kerja Azure Synapse tertentu ke direktori perantara di OneLake. Synapse API digunakan untuk mengekspor notebook.
- 1.2) Konfigurasikan parameter dalam perintah pertama untuk mengekspor notebook ke penyimpanan menengah (OneLake). Cuplikan berikut digunakan untuk mengonfigurasi parameter sumber dan tujuan. Pastikan untuk menggantinya dengan nilai Anda sendiri.
# Azure config
azure_client_id = "<client_id>"
azure_tenant_id = "<tenant_id>"
azure_client_secret = "<client_secret>"
# Azure Synapse workspace config
synapse_workspace_name = "<synapse_workspace_name>"
# Fabric config
workspace_id = "<workspace_id>"
lakehouse_id = "<lakehouse_id>"
export_folder_name = f"export/{synapse_workspace_name}"
prefix = "" # this prefix is used during import {prefix}{notebook_name}
output_folder = f"abfss://{workspace_id}@onelake.dfs.fabric.microsoft.com/{lakehouse_id}/Files/{export_folder_name}"
- 1.3) Jalankan dua sel pertama notebook ekspor/impor untuk mengekspor buku catatan ke OneLake. Setelah sel selesai, struktur folder ini di bawah direktori output menengah dibuat.
Langkah 2: Impor notebook ke Fabric
Langkah 2 adalah ketika notebook diimpor dari penyimpanan perantara ke ruang kerja Fabric. Proses ini adalah sebagai berikut:
- 2.1) Validasi konfigurasi di langkah 1.2 untuk memastikan ruang kerja Fabric dan nilai awalan yang tepat ditunjukkan untuk mengimpor buku catatan.
- 2.2) Jalankan sel ketiga buku catatan ekspor/impor untuk mengimpor semua buku catatan dari lokasi perantara.