แชร์ผ่าน


ใช้ Livy API เพื่อส่งและดําเนินการงาน Spark

หมายเหตุ

Livy API สําหรับ Fabric วิศวกรข้อมูล ing อยู่ในตัวอย่าง

นําไปใช้กับ:✅ วิศวกรข้อมูลและวิทยาศาสตร์ข้อมูลใน Microsoft Fabric

เริ่มต้นใช้งานด้วย Livy API สําหรับ Fabric วิศวกรข้อมูล ing โดยการสร้าง Lakehouse โดยการรับรองความถูกต้องด้วยโทเค็นแอป Microsoft Entra ส่งงานชุดหรือเซสชันจากไคลเอ็นต์ระยะไกลไปยัง Fabric Spark compute คุณจะพบจุดสิ้นสุด Livy API ส่งงาน; งาน และตรวจสอบผลลัพธ์

ข้อกำหนดเบื้องต้น

การเลือก REST API client

คุณสามารถใช้ภาษาการเขียนโปรแกรมต่าง ๆ หรือไคลเอ็นต์ GUI เพื่อโต้ตอบกับจุดสิ้นสุด REST API ในบทความนี้ เราใช้ Visual Studio Code Visual Studio Code จําเป็นต้องกําหนดค่าด้วย Jupyter Notebooks, PySpark และ ไลบรารีการรับรองความถูกต้องของ Microsoft (MSAL) สําหรับ Python

วิธีการอนุญาตคําขอ API ของ Livy

เมื่อต้องการทํางานกับ Fabric API รวมถึง Livy API ก่อนอื่นคุณต้องสร้างแอปพลิเคชัน Microsoft Entra และรับโทเค็น แอปพลิเคชันของคุณต้องลงทะเบียน และกําหนดค่าอย่างเพียงพอเพื่อดําเนินการเรียกใช้ API กับ Fabric สําหรับข้อมูลเพิ่มเติม ให้ดู ลงทะเบียนแอปพลิเคชันด้วยแพลตฟอร์มข้อมูลประจำตัวของ Microsoft

มีสิทธิในขอบเขตของ Microsoft Entra จํานวนมากที่จําเป็นในการดําเนินการงาน Livy ตัวอย่างนี้ใช้รหัส Spark อย่างง่าย + การเข้าถึงที่เก็บข้อมูล + SQL:

  • Code.AccessAzureDataExplorer.All
  • Code.AccessAzureDataLake.All
  • Code.AccessAzureKeyvault.All
  • Code.AccessFabric.All
  • Code.AccessStorage.All
  • Item.ReadWrite.All
  • Lakehouse.Execute.All
  • Lakehouse.Read.All
  • Workspace.ReadWrite.All

สกรีนช็อตที่แสดงสิทธิ์ Livy API ในศูนย์การจัดการ Microsoft Entra

หมายเหตุ

ในระหว่างการแสดงตัวอย่างสาธารณะ เราจะเพิ่มขอบเขตย่อยเพิ่มเติมบางอย่าง และถ้าคุณใช้วิธีนี้ เมื่อเราเพิ่มขอบเขตเพิ่มเติมเหล่านี้ แอป Livy ของคุณจะหยุดทํางาน โปรดตรวจสอบรายการนี้เนื่องจากจะได้รับการอัปเดตด้วยขอบเขตเพิ่มเติม

ลูกค้าบางรายต้องการสิทธิ์ที่ละเอียดมากกว่ารายการก่อนหน้า คุณสามารถลบ Item.ReadWrite.All และแทนที่ด้วยสิทธิ์ระดับแยกย่อยเหล่านี้ได้:

  • Code.AccessAzureDataExplorer.All
  • Code.AccessAzureDataLake.All
  • Code.AccessAzureKeyvault.All
  • Code.AccessFabric.All
  • Code.AccessStorage.All
  • Lakehouse.Execute.All
  • Lakehouse.ReadWrite.All
  • Workspace.ReadWrite.All
  • Notebook.ReadWrite.All
  • SparkJobDefinition.ReadWrite.All
  • MLModel.ReadWrite.All
  • MLExperiment.ReadWrite.All
  • Dataset.ReadWrite.All

เมื่อคุณลงทะเบียนแอปพลิเคชันของคุณแล้ว คุณจะต้องมีทั้ง ID แอปพลิเคชัน (ไคลเอนต์) และ ID ไดเรกทอรี (ผู้เช่า)

สกรีนช็อตแสดงภาพรวมแอป Livy API ในศูนย์การจัดการ Microsoft Entra

ผู้ใช้ที่ได้รับการรับรองความถูกต้องที่เรียก Livy API จําเป็นต้องเป็นสมาชิกพื้นที่ทํางานที่ทั้ง API และรายการแหล่งข้อมูลมีบทบาทผู้สนับสนุน สําหรับข้อมูลเพิ่มเติม ให้ดู ให้ผู้ใช้สามารถเข้าถึงพื้นที่ทํางาน

วิธีการค้นหาจุดสิ้นสุด Fabric Livy API

สิ่งประดิษฐ์ของเลคเฮ้าส์จําเป็นสําหรับการเข้าถึงจุดสิ้นสุดของ Livy เมื่อสร้าง Lakehouse แล้ว จุดสิ้นสุด Livy API สามารถอยู่ภายในแผงการตั้งค่าได้

สกรีนช็อตแสดงจุดสิ้นสุด Livy API ในการตั้งค่า Lakehouse

จุดสิ้นสุดของ Livy API จะเป็นไปตามรูปแบบนี้:

https://api.fabric.microsoft.com/v1/workspaces/ < >ws_id/เลคเฮ้าส์/<lakehouse_id>/livyapi/versions/2023-12-01/

URL จะถูกผนวกเข้ากับเซสชัน<หรือ>ชุดงาน<โดย>ขึ้นอยู่กับสิ่งที่คุณเลือก

การรวมกับสภาพแวดล้อม Fabric

สําหรับแต่ละพื้นที่ทํางาน Fabric มีการเตรียมใช้งานพูลเริ่มต้น การดําเนินการของโค้ด Spark ทั้งหมดจะใช้กลุ่มเริ่มต้นนี้ตามค่าเริ่มต้น คุณสามารถใช้สภาพแวดล้อม Fabric เพื่อปรับแต่งงาน Livy API Spark

ดาวน์โหลดไฟล์ Swagger API Livy

ไฟล์ Swagger แบบเต็มสําหรับ Livy API จะพร้อมใช้งานที่นี่

ส่งงาน Livy API

ตอนนี้การตั้งค่าของ Livy API เสร็จสมบูรณ์แล้ว คุณสามารถเลือกที่จะส่งชุดงานหรือเซสชันงานได้

วิธีการตรวจสอบประวัติคําขอ

คุณสามารถใช้ฮับการตรวจสอบเพื่อดูการส่ง Livy API ก่อนหน้าของคุณ และแก้ไขจุดบกพร่องของข้อผิดพลาดในการส่งได้

สกรีนช็อตที่แสดงการส่ง Livy API ก่อนหน้านี้ในฮับการตรวจสอบ