Bagikan melalui


Menyiapkan data dengan manipulasi data

BERLAKU UNTUK: Azure Data Factory Azure Synapse Analytics

Tip

Cobalah Data Factory di Microsoft Fabric, solusi analitik all-in-one untuk perusahaan. Microsoft Fabric mencakup semuanya mulai dari pergerakan data hingga ilmu data, analitik real time, kecerdasan bisnis, dan pelaporan. Pelajari cara memulai uji coba baru secara gratis!

Manipulasi data di pabrik data memungkinkan Anda membuat gabungan Power Query interaktif secara native di ADF, lalu menjalankannya dalam skala besar di dalam alur ADF.

Membuat aktivitas Power Query

Ada dua cara untuk membuat Power Query di Azure Data Factory. Salah satu caranya adalah dengan mengeklik ikon plus dan memilih Power Query di panel sumber daya pabrik.

Cuplikan layar yang memperlihatkan Power Query di panel sumber daya pabrik.

Metode lain ada di panel aktivitas kanvas alur. Buka akordeon Power Query dan tarik aktivitas Power Query ke kanvas.

Cuplikan layar yang menyoroti opsi manipulasi data.

Tulis aktivitas manipulasi data Power Query

Tambahkan himpunan data Sumber untuk gabungan Power Query Anda. Anda bisa memilih himpunan data yang sudah ada atau membuat yang baru. Setelah menyimpan mash-up, Anda kemudian dapat membuat alur, menambahkan aktivitas manipulasi data Power Query ke alur Anda dan memilih himpunan data sink untuk memberi tahu ADF tempat untuk mendaratkan data Anda. Meskipun Anda dapat memilih satu atau beberapa kumpulan data sumber, hanya satu sink yang diizinkan saat ini. Memilih himpunan data sink bersifat opsional, tetapi setidaknya diperlukan satu himpunan data sumber.

Wrangling

Klik Buat untuk membuka editor gabungan Power Query Online.

Pertama, Anda memilih sumber set data dari editor mashup.

Sumber Power Query.

Setelah selesai membuat Power Query, Anda bisa menyimpannya lalu membuat alur. Anda perlu menambahkan mashup sebagai aktivitas ke alur Anda. Saat itulah Anda akan membuat/memilih himpunan data sink untuk mendaratkan data Anda. Anda juga dapat mengatur properti himpunan data sink dengan mengklik tombol kedua di sisi kanan himpunan data yang disink. Ingatlah untuk mengubah "opsi partisi" di bawah "Optimalkan" menjadi "Partisi tunggal" jika Anda hanya ingin mendapatkan satu file output.

Sink Power Query.

Buat Power Query manipulasi Anda menggunakan persiapan data bebas kode. Untuk daftar fungsi yang tersedia, lihat fungsi transformasi. ADF menerjemahkan skrip M ke dalam skrip aliran data sehingga Anda bisa menjalankan Power Query dalam skala besar menggunakan lingkungan Spark aliran data Azure Data Factory.

Cuplikan layar yang memperlihatkan proses penulisan manipulasi data Power Query Anda.

Menjalankan dan memantau aktivitas manipulasi data Power Query

Untuk menjalankan proses debug alur aktivitas Power Query, klik Debug di kanvas alur. Setelah Anda menerbitkan alur Anda, Picu sekarang menjalankan proses on-demand dari alur terakhir yang diterbitkan. Alur Power Query bisa dijadwal dengan semua pemicu Azure Data Factory yang sudah ada.

Cuplikan layar yang memperlihatkan cara menambahkan aktivitas manipulasi data Power Query.

Masuk ke tab Monitor untuk memvisualisasikan output proses aktivitas Power Query yang dipicu.

Cuplikan layar yang memperlihatkan output dari proses aktivitas Power Query manipulasi yang dipicu.

Pelajari cara membuat alur data pemetaan.