แชร์ผ่าน


โยกย้ายสมุดบันทึกจาก Azure Synapse Analytics ไปยัง Fabric

Azure Synapse และ Fabric รองรับสมุดบันทึก การโยกย้ายสมุดบันทึกจาก Azure Synapse ไปยัง Fabric สามารถทําได้ในสองวิธี:

  • ตัวเลือกที่ 1: คุณสามารถส่งออกสมุดบันทึกจาก Azure Synapse (.ipynb) และนําเข้าไปยัง Fabric (ด้วยตนเอง)
  • ตัวเลือกที่ 2: คุณสามารถใช้สคริปต์เพื่อส่งออกสมุดบันทึกจาก Azure Synapse และนําเข้าไปยัง Fabric โดยใช้ API ได้

สําหรับข้อควรพิจารณาของสมุดบันทึก โปรดดูความแตกต่างระหว่าง Azure Synapse Spark และ Fabric

ข้อกำหนดเบื้องต้น

ถ้าคุณยังไม่มี พื้นที่ทํางาน Fabric ในผู้เช่าของคุณ

ตัวเลือกที่ 1: ส่งออกและนําเข้าสมุดบันทึกด้วยตนเอง

เมื่อต้องการส่งออกสมุดบันทึกจาก Azure Synapse:

  1. เปิด Synapse Studio: ลงชื่อเข้าใช้ Azure นําทางไปยังพื้นที่ทํางาน Azure Synapse ของคุณและเปิด Synapse Studio
  2. ค้นหาสมุดบันทึก: ใน Synapse Studio ค้นหาสมุดบันทึกที่คุณต้องการส่งออกจาก ส่วนสมุดบันทึก ของพื้นที่ทํางานของคุณ
  3. ส่งออกสมุดบันทึก:
    • คลิกขวาบนสมุดบันทึกที่คุณต้องการส่งออก
    • เลือก ส่งออก>สมุดบันทึก (.ipynb)
    • เลือกโฟลเดอร์ปลายทางและใส่ชื่อสําหรับไฟล์สมุดบันทึกที่ส่งออก
  4. เมื่อการส่งออกเสร็จสมบูรณ์ คุณควรมีไฟล์สมุดบันทึกที่พร้อมใช้งานสําหรับการอัปโหลด

สกรีนช็อตที่แสดงการส่งออกสมุดบันทึก Synapse

เมื่อต้องการนําเข้าสมุดบันทึกที่ส่งออกใน Fabric:

  1. เข้าถึงพื้นที่ทํางาน Fabric: ลงชื่อเข้าใช้ Fabric และเข้าถึงพื้นที่ทํางานของคุณ
  2. นําทางไปยังวิศวกรข้อมูลหน้าแรก: เมื่ออยู่ในพื้นที่ทํางาน Fabric ของคุณไปที่หน้าแรกของ วิศวกรข้อมูล
  3. นําเข้าสมุดบันทึก:
    • เลือก นําเข้าสมุดบันทึก คุณสามารถนําเข้าสมุดบันทึกที่มีอยู่อย่างน้อยหนึ่งรายการจากคอมพิวเตอร์เฉพาะที่ของคุณไปยังพื้นที่ทํางาน Fabric
    • เรียกดูไฟล์สมุดบันทึก .ipynb ที่คุณดาวน์โหลดจาก Azure Synapse Analytics
    • เลือกไฟล์สมุดบันทึกแล้วคลิก อัปโหลด
  4. เปิดและใช้สมุดบันทึก: เมื่อการนําเข้าเสร็จสมบูรณ์ คุณสามารถเปิดและใช้สมุดบันทึกในพื้นที่ทํางาน Fabric ของคุณได้

เมื่อมีการนําเข้าสมุดบันทึก ให้ตรวจสอบการขึ้นต่อกันของสมุดบันทึก:

  • ตรวจสอบให้แน่ใจว่าใช้ Spark เวอร์ชันเดียวกัน
  • ถ้าคุณกําลังใช้สมุดบันทึกอ้างอิง คุณสามารถใช้ msparkutils กับ Fabric ได้ อย่างไรก็ตาม ถ้าคุณนําเข้าสมุดบันทึกที่อ้างอิงอีกเล่มหนึ่ง คุณจําเป็นต้องนําเข้าสมุดบันทึกฉบับต่อมาด้วย พื้นที่ทํางานของ Fabric ไม่รองรับโฟลเดอร์ในขณะนี้ ดังนั้นการอ้างอิงไปยังสมุดบันทึกในโฟลเดอร์อื่น ๆ ควรได้รับการอัปเดต คุณสามารถใช้ ทรัพยากร ของสมุดบันทึกได้ถ้าจําเป็น
  • ถ้าสมุดบันทึกใช้ไลบรารีและการกําหนดค่าเฉพาะสําหรับพูล คุณจําเป็นต้องนําเข้าไลบรารีและ/หรือการกําหนดค่าเหล่านั้นด้วย
  • บริการที่เชื่อมโยง การเชื่อมต่อแหล่งข้อมูล และจุดต่อเชื่อม

ตัวเลือกที่ 2: ใช้ Fabric API

ทําตามขั้นตอนหลักเหล่านี้สําหรับการโยกย้าย:

  • ข้อกําหนดเบื้องต้น
  • ขั้นตอนที่ 1: ส่งออกสมุดบันทึกจาก Azure Synapse ไปยัง OneLake (.ipynb)
  • ขั้นตอนที่ 2: นําเข้าสมุดบันทึกโดยอัตโนมัติลงใน Fabric โดยใช้ Fabric API

ข้อกำหนดเบื้องต้น

ข้อกําหนดเบื้องต้นรวมถึงการดําเนินการที่คุณต้องพิจารณาก่อนเริ่มการโยกย้ายสมุดบันทึกไปยัง Fabric

  • พื้นที่ทํางานของ Fabric
  • ถ้าคุณยังไม่มี ให้ สร้าง Fabric lakehouse ในพื้นที่ทํางานของคุณ

ขั้นตอนที่ 1: ส่งออกสมุดบันทึกจากพื้นที่ทํางาน Azure Synapse

จุดมุ่งเน้นของขั้นตอนที่ 1 คือการส่งออกสมุดบันทึกจากพื้นที่ทํางาน Azure Synapse ไปยัง OneLake ในรูปแบบ .ipynb กระบวนการนี้มีดังนี้:

  • 1.1) นําเข้าสมุดบันทึกการโยกย้ายไปยังพื้นที่ทํางานของ Fabric สมุดบันทึก นี้ส่งออกสมุดบันทึกทั้งหมดจากพื้นที่ทํางาน Azure Synapse ที่กําหนดไปยังไดเรกทอรีระดับกลางใน OneLake Synapse API ถูกใช้เพื่อส่งออกสมุดบันทึก
  • 1.2) กําหนดค่าพารามิเตอร์ ในคําสั่งแรกเพื่อส่งออกสมุดบันทึกไปยังที่เก็บข้อมูลระดับกลาง (OneLake) ส่วนย่อยต่อไปนี้ถูกใช้เพื่อกําหนดค่าพารามิเตอร์ต้นทางและปลายทาง ตรวจสอบให้แน่ใจว่าได้แทนที่ด้วยค่าของคุณเอง
# Azure config
azure_client_id = "<client_id>"
azure_tenant_id = "<tenant_id>"
azure_client_secret = "<client_secret>"

# Azure Synapse workspace config
synapse_workspace_name = "<synapse_workspace_name>"

# Fabric config
workspace_id = "<workspace_id>"
lakehouse_id = "<lakehouse_id>"
export_folder_name = f"export/{synapse_workspace_name}"
prefix = "" # this prefix is used during import {prefix}{notebook_name}

output_folder = f"abfss://{workspace_id}@onelake.dfs.fabric.microsoft.com/{lakehouse_id}/Files/{export_folder_name}"
  • 1.3) เรียกใช้สองเซลล์ แรกของการส่งออก/นําเข้าสมุดบันทึกเพื่อส่งออกสมุดบันทึกไปยัง OneLake เมื่อเซลล์เสร็จสมบูรณ์ โครงสร้างโฟลเดอร์นี้ภายใต้ไดเรกทอรีผลลัพธ์ระดับกลางจะถูกสร้างขึ้น

สกรีนช็อตที่แสดงการส่งออกสมุดบันทึกใน OneLake

ขั้นตอนที่ 2: นําเข้าสมุดบันทึกลงใน Fabric

ขั้นตอนที่ 2 คือเมื่อมีการนําเข้าสมุดบันทึกจากที่เก็บข้อมูลระดับกลางลงในพื้นที่ทํางาน Fabric กระบวนการนี้มีดังนี้:

  • 2.1) ตรวจสอบการกําหนดค่า ในขั้นตอนที่ 1.2 เพื่อให้แน่ใจว่าพื้นที่ทํางาน Fabric และค่าคํานําหน้าถูกระบุเพื่อนําเข้าสมุดบันทึก
  • 2.2) เรียกใช้เซลล์ ที่สามของสมุดบันทึกส่งออก/นําเข้าเพื่อนําเข้าสมุดบันทึกทั้งหมดจากตําแหน่งที่ตั้งระดับกลาง