Bagikan melalui


Menyambungkan ke ADLS dan mengubah data dengan Azure Databricks

Dalam panduan ini, Anda akan:

  • Buat tabel Delta di akun Azure Data Lake Storage (ADLS) Gen2 Anda menggunakan Azure Databricks.

  • Buat pintasan OneLake ke tabel Delta di ADLS.

  • Gunakan Power BI untuk menganalisis data melalui pintasan ADLS.

Prasyarat

Sebelum memulai, Anda harus memiliki:

  • Ruang kerja dengan item Lakehouse

  • Ruang kerja Azure Databricks

  • Akun ADLS Gen2 untuk menyimpan tabel Delta

Membuat tabel Delta, membuat pintasan, dan menganalisis data

  1. Menggunakan notebook Azure Databricks, buat tabel Delta di akun ADLS Gen2 Anda.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. Di lakehouse Anda, pilih elipsis (...) di samping Tabel lalu pilih Pintasan baru.

    Cuplikan layar memperlihatkan lokasi Pintasan Baru dalam Tabel.

  3. Di layar Pintasan baru, pilih petak peta Azure Data Lake Storage Gen2.

    Cuplikan layar opsi petak peta di layar Pintasan baru.

  4. Tentukan detail koneksi untuk pintasan dan pilih Berikutnya.

    Cuplikan layar memperlihatkan tempat memasukkan pengaturan Koneksi untuk pintasan baru.

  5. Tentukan detail pintasan. Berikan detail Nama Pintasan dan Sub jalur lalu pilih Buat. Sub jalur harus menunjuk ke direktori tempat tabel Delta berada.

    Cuplikan layar memperlihatkan tempat memasukkan detail pintasan baru.

  6. Pintasan muncul sebagai tabel Delta di bawah Tabel.

    Cuplikan layar memperlihatkan lokasi pintasan ADLS yang baru dibuat.

  7. Sekarang Anda bisa mengkueri data ini langsung dari buku catatan.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Untuk mengakses dan menganalisis tabel Delta ini melalui Power BI, pilih Model semantik Power BI baru.

    Cuplikan layar memperlihatkan cara membuat model semantik Power BI baru.

  9. Pilih pintasan lalu pilih Konfirmasi.

    Cuplikan layar memperlihatkan penyiapan model semantik baru.

  10. Saat data diterbitkan, pilih Mulai dari awal.

    Cuplikan layar memperlihatkan proses untuk menyiapkan himpunan data.

  11. Dalam pengalaman penulisan laporan, data pintasan muncul sebagai tabel bersama dengan semua atributnya.

    Cuplikan layar memperlihatkan pengalaman penulisan dan atribut tabel.

  12. Untuk membuat laporan Power BI, seret atribut ke panel di sisi kiri.

    Cuplikan layar memperlihatkan data yang sedang dikueri melalui laporan Power BI.