โยกย้ายสมุดบันทึกจาก Azure Synapse Analytics ไปยัง Fabric
Azure Synapse และ Fabric รองรับสมุดบันทึก การโยกย้ายสมุดบันทึกจาก Azure Synapse ไปยัง Fabric สามารถทําได้ในสองวิธี:
- ตัวเลือกที่ 1: คุณสามารถส่งออกสมุดบันทึกจาก Azure Synapse (.ipynb) และนําเข้าไปยัง Fabric (ด้วยตนเอง)
- ตัวเลือกที่ 2: คุณสามารถใช้สคริปต์เพื่อส่งออกสมุดบันทึกจาก Azure Synapse และนําเข้าไปยัง Fabric โดยใช้ API ได้
สําหรับข้อควรพิจารณาของสมุดบันทึก โปรดดูความแตกต่างระหว่าง Azure Synapse Spark และ Fabric
ข้อกำหนดเบื้องต้น
ถ้าคุณยังไม่มี พื้นที่ทํางาน Fabric ในผู้เช่าของคุณ
ตัวเลือกที่ 1: ส่งออกและนําเข้าสมุดบันทึกด้วยตนเอง
เมื่อต้องการส่งออกสมุดบันทึกจาก Azure Synapse:
- เปิด Synapse Studio: ลงชื่อเข้าใช้ Azure นําทางไปยังพื้นที่ทํางาน Azure Synapse ของคุณและเปิด Synapse Studio
- ค้นหาสมุดบันทึก: ใน Synapse Studio ค้นหาสมุดบันทึกที่คุณต้องการส่งออกจาก ส่วนสมุดบันทึก ของพื้นที่ทํางานของคุณ
-
ส่งออกสมุดบันทึก:
- คลิกขวาบนสมุดบันทึกที่คุณต้องการส่งออก
- เลือก ส่งออก>สมุดบันทึก (.ipynb)
- เลือกโฟลเดอร์ปลายทางและใส่ชื่อสําหรับไฟล์สมุดบันทึกที่ส่งออก
- เมื่อการส่งออกเสร็จสมบูรณ์ คุณควรมีไฟล์สมุดบันทึกที่พร้อมใช้งานสําหรับการอัปโหลด
เมื่อต้องการนําเข้าสมุดบันทึกที่ส่งออกใน Fabric:
- เข้าถึงพื้นที่ทํางาน Fabric: ลงชื่อเข้าใช้ Fabric และเข้าถึงพื้นที่ทํางานของคุณ
- นําทางไปยังวิศวกรข้อมูลหน้าแรก: เมื่ออยู่ในพื้นที่ทํางาน Fabric ของคุณไปที่หน้าแรกของ วิศวกรข้อมูล
-
นําเข้าสมุดบันทึก:
- เลือก นําเข้าสมุดบันทึก คุณสามารถนําเข้าสมุดบันทึกที่มีอยู่อย่างน้อยหนึ่งรายการจากคอมพิวเตอร์เฉพาะที่ของคุณไปยังพื้นที่ทํางาน Fabric
- เรียกดูไฟล์สมุดบันทึก .ipynb ที่คุณดาวน์โหลดจาก Azure Synapse Analytics
- เลือกไฟล์สมุดบันทึกแล้วคลิก อัปโหลด
- เปิดและใช้สมุดบันทึก: เมื่อการนําเข้าเสร็จสมบูรณ์ คุณสามารถเปิดและใช้สมุดบันทึกในพื้นที่ทํางาน Fabric ของคุณได้
เมื่อมีการนําเข้าสมุดบันทึก ให้ตรวจสอบการขึ้นต่อกันของสมุดบันทึก:
- ตรวจสอบให้แน่ใจว่าใช้ Spark เวอร์ชันเดียวกัน
- ถ้าคุณกําลังใช้สมุดบันทึกอ้างอิง คุณสามารถใช้ msparkutils กับ Fabric ได้ อย่างไรก็ตาม ถ้าคุณนําเข้าสมุดบันทึกที่อ้างอิงอีกเล่มหนึ่ง คุณจําเป็นต้องนําเข้าสมุดบันทึกฉบับต่อมาด้วย พื้นที่ทํางานของ Fabric ไม่รองรับโฟลเดอร์ในขณะนี้ ดังนั้นการอ้างอิงไปยังสมุดบันทึกในโฟลเดอร์อื่น ๆ ควรได้รับการอัปเดต คุณสามารถใช้ ทรัพยากร ของสมุดบันทึกได้ถ้าจําเป็น
- ถ้าสมุดบันทึกใช้ไลบรารีและการกําหนดค่าเฉพาะสําหรับพูล คุณจําเป็นต้องนําเข้าไลบรารีและ/หรือการกําหนดค่าเหล่านั้นด้วย
- บริการที่เชื่อมโยง การเชื่อมต่อแหล่งข้อมูล และจุดต่อเชื่อม
ตัวเลือกที่ 2: ใช้ Fabric API
ทําตามขั้นตอนหลักเหล่านี้สําหรับการโยกย้าย:
- ข้อกําหนดเบื้องต้น
- ขั้นตอนที่ 1: ส่งออกสมุดบันทึกจาก Azure Synapse ไปยัง OneLake (.ipynb)
- ขั้นตอนที่ 2: นําเข้าสมุดบันทึกโดยอัตโนมัติลงใน Fabric โดยใช้ Fabric API
ข้อกำหนดเบื้องต้น
ข้อกําหนดเบื้องต้นรวมถึงการดําเนินการที่คุณต้องพิจารณาก่อนเริ่มการโยกย้ายสมุดบันทึกไปยัง Fabric
- พื้นที่ทํางานของ Fabric
- ถ้าคุณยังไม่มี ให้ สร้าง Fabric lakehouse ในพื้นที่ทํางานของคุณ
ขั้นตอนที่ 1: ส่งออกสมุดบันทึกจากพื้นที่ทํางาน Azure Synapse
จุดมุ่งเน้นของขั้นตอนที่ 1 คือการส่งออกสมุดบันทึกจากพื้นที่ทํางาน Azure Synapse ไปยัง OneLake ในรูปแบบ .ipynb กระบวนการนี้มีดังนี้:
- 1.1) นําเข้าสมุดบันทึกการโยกย้ายไปยังพื้นที่ทํางานของ Fabric สมุดบันทึก นี้ส่งออกสมุดบันทึกทั้งหมดจากพื้นที่ทํางาน Azure Synapse ที่กําหนดไปยังไดเรกทอรีระดับกลางใน OneLake Synapse API ถูกใช้เพื่อส่งออกสมุดบันทึก
- 1.2) กําหนดค่าพารามิเตอร์ ในคําสั่งแรกเพื่อส่งออกสมุดบันทึกไปยังที่เก็บข้อมูลระดับกลาง (OneLake) ส่วนย่อยต่อไปนี้ถูกใช้เพื่อกําหนดค่าพารามิเตอร์ต้นทางและปลายทาง ตรวจสอบให้แน่ใจว่าได้แทนที่ด้วยค่าของคุณเอง
# Azure config
azure_client_id = "<client_id>"
azure_tenant_id = "<tenant_id>"
azure_client_secret = "<client_secret>"
# Azure Synapse workspace config
synapse_workspace_name = "<synapse_workspace_name>"
# Fabric config
workspace_id = "<workspace_id>"
lakehouse_id = "<lakehouse_id>"
export_folder_name = f"export/{synapse_workspace_name}"
prefix = "" # this prefix is used during import {prefix}{notebook_name}
output_folder = f"abfss://{workspace_id}@onelake.dfs.fabric.microsoft.com/{lakehouse_id}/Files/{export_folder_name}"
- 1.3) เรียกใช้สองเซลล์ แรกของการส่งออก/นําเข้าสมุดบันทึกเพื่อส่งออกสมุดบันทึกไปยัง OneLake เมื่อเซลล์เสร็จสมบูรณ์ โครงสร้างโฟลเดอร์นี้ภายใต้ไดเรกทอรีผลลัพธ์ระดับกลางจะถูกสร้างขึ้น
ขั้นตอนที่ 2: นําเข้าสมุดบันทึกลงใน Fabric
ขั้นตอนที่ 2 คือเมื่อมีการนําเข้าสมุดบันทึกจากที่เก็บข้อมูลระดับกลางลงในพื้นที่ทํางาน Fabric กระบวนการนี้มีดังนี้:
- 2.1) ตรวจสอบการกําหนดค่า ในขั้นตอนที่ 1.2 เพื่อให้แน่ใจว่าพื้นที่ทํางาน Fabric และค่าคํานําหน้าถูกระบุเพื่อนําเข้าสมุดบันทึก
- 2.2) เรียกใช้เซลล์ ที่สามของสมุดบันทึกส่งออก/นําเข้าเพื่อนําเข้าสมุดบันทึกทั้งหมดจากตําแหน่งที่ตั้งระดับกลาง