Menyambungkan ke ADLS dan mengubah data dengan Azure Databricks
Dalam panduan ini, Anda akan:
Buat tabel Delta di akun Azure Data Lake Storage (ADLS) Gen2 Anda menggunakan Azure Databricks.
Buat pintasan OneLake ke tabel Delta di ADLS.
Gunakan Power BI untuk menganalisis data melalui pintasan ADLS.
Prasyarat
Sebelum memulai, Anda harus memiliki:
Ruang kerja dengan item Lakehouse
Ruang kerja Azure Databricks
Akun ADLS Gen2 untuk menyimpan tabel Delta
Membuat tabel Delta, membuat pintasan, dan menganalisis data
Menggunakan notebook Azure Databricks, buat tabel Delta di akun ADLS Gen2 Anda.
# Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>" # Read Parquet files from an ADLS account df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/") # Write Delta tables to ADLS account df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
Di lakehouse Anda, pilih elipsis (...) di samping Tabel lalu pilih Pintasan baru.
Di layar Pintasan baru, pilih petak peta Azure Data Lake Storage Gen2.
Tentukan detail koneksi untuk pintasan dan pilih Berikutnya.
Tentukan detail pintasan. Berikan detail Nama Pintasan dan Sub jalur lalu pilih Buat. Sub jalur harus menunjuk ke direktori tempat tabel Delta berada.
Pintasan muncul sebagai tabel Delta di bawah Tabel.
Sekarang Anda bisa mengkueri data ini langsung dari buku catatan.
df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000") display(df)
Untuk mengakses dan menganalisis tabel Delta ini melalui Power BI, pilih Model semantik Power BI baru.
Pilih pintasan lalu pilih Konfirmasi.
Saat data diterbitkan, pilih Mulai dari awal.
Dalam pengalaman penulisan laporan, data pintasan muncul sebagai tabel bersama dengan semua atributnya.
Untuk membuat laporan Power BI, seret atribut ke panel di sisi kiri.