Bagikan melalui


Modul 1: Membuat alur dengan Data Factory

Modul ini membutuhkan waktu 10 menit, menyerap data mentah dari penyimpanan sumber ke dalam tabel Perunggu data Lakehouse menggunakan aktivitas Salin dalam alur.

Langkah-langkah tingkat tinggi dalam modul 1 adalah sebagai berikut:

  1. Buat jalur pemrosesan data.
  2. Gunakan Aktivitas Salin di alur untuk memuat data sampel ke dalam data Lakehouse.

Membuat alur data

  1. Diperlukan akun penyewa Microsoft Fabric dengan langganan yang aktif. Buat akun gratis.

  2. Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.

  3. Masuk ke dalam Power BI.

  4. Pilih ikon Power BI default di kiri bawah layar, dan pilih Fabric.

    Cuplikan layar memperlihatkan pilihan pengalaman Data Factory.

  5. Pilih ruang kerja dari tab Ruang Kerja, lalu pilih + Item baru, dan pilih alur data . Berikan nama alur. Lalu pilih Buat.

    Cuplikan layar halaman mulai Data Factory dengan tombol untuk membuat alur data baru yang dipilih.

    Cuplikan layar memperlihatkan dialog untuk memberi nama alur baru.

Gunakan aktivitas Salin di pipeline untuk memuat data sampel ke Data Lakehouse

Langkah 1: Gunakan asisten salin untuk mengonfigurasi aktivitas salin.

Pilih Asisten Salin Data untuk membuka fitur asisten salin.

Cuplikan layar yang menunjukkan pemilihan aktivitas Salin data dari halaman awal pipeline baru.

Langkah 2: Konfigurasikan pengaturan Anda di asisten salin.

  1. Dialog Salin data ditampilkan dengan langkah pertama, Pilih sumber data, disorot. Pilih Contoh data dari opsi di bagian atas dialog, lalu pilih NYC Taxi - Green.

    Cuplikan layar memperlihatkan pemilihan Taksi NYC - Data hijau di asisten salin pada tab Pilih sumber data.

  2. Pratinjau sumber data muncul di samping halaman Sambungkan ke sumber data. Tinjau, lalu pilih Berikutnya.

    Cuplikan layar memperlihatkan data pratinjau untuk himpunan data sampel Taksi - Hijau NYC.

  3. Untuk langkah Pilih tujuan data asisten salin, pilih Lakehouse lalu Berikutnya.

    Cuplikan layar memperlihatkan pilihan tujuan Lakehouse pada tab Pilih tujuan data dari asisten Salin data.

  4. Pilih Buat Lakehouse baru di halaman konfigurasi tujuan data yang muncul, dan masukkan nama untuk Lakehouse baru. Lalu pilih Berikutnya lagi.

    Cuplikan layar memperlihatkan halaman konfigurasi tujuan data asisten Salin, memilih opsi Buat Lakehouse baru dan berikan nama Lakehouse.

  5. Sekarang konfigurasikan detail tujuan Lakehouse Anda di halaman Pilih dan petakan ke jalur folder atau tabel. Pilih Tabel untuk folder Akar , berikan nama tabel, dan pilih tindakan Timpa. Jangan centang kotak centang Aktifkan partisi yang muncul setelah Anda memilih tindakan Timpa tabel.

    Cuplikan layar memperlihatkan tab Sambungkan ke tujuan data dari asisten Salin data, pada langkah Pilih dan petakan ke jalur folder atau tabel.

  6. Terakhir, pada halaman Tinjau dan simpan asisten penyalinan data, tinjau konfigurasi. Untuk tutorial ini, hapus centang pada kotak centang Mulai transfer data segera, karena kami menjalankan aktivitas secara manual di langkah berikutnya. Kemudian pilih OK.

    Cuplikan layar memperlihatkan asisten Salin data di halaman Tinjau + simpan.

Langkah 3: Jalankan dan lihat hasil aktivitas Salin Anda.

  1. Pilih tab Jalankan di editor pipeline. Kemudian pilih tombol Jalankan, lalu Simpan dan jalankan pada perintah, untuk menjalankan aktivitas Salin.

    Cuplikan layar memperlihatkan tab Eksekusi alur dengan tombol Jalankan disorot.

    Cuplikan layar memperlihatkan dialog Simpan dan jalankan dengan tombol Simpan dan jalankan disorot.

  2. Anda dapat memantau eksekusi dan memeriksa hasilnya pada tab Output di bawah kanvas alur. Pilih tombol "Detail Eksekusi" (ikon "kacamata" yang muncul saat Anda mengarahkan kursor ke eksekusi alur yang sedang berjalan) untuk melihat detail eksekusi.

    Cuplikan layar memperlihatkan tombol detail pelaksanaan di tab Output alur.

  3. Detail pemrosesan menunjukkan 1,508,501 baris dibaca dan ditulis.

    Cuplikan layar detail Salin data untuk pengoperasian rangkaian proses.

  4. Perluas bagian perincian Durasi untuk melihat durasi setiap tahap aktivitas Salin. Setelah meninjau detail salinan, pilih Tutup.

    Cuplikan layar memperlihatkan perincian durasi pelaksanaan aktivitas penyalinan.

Dalam modul pertama dari tutorial end-to-end kami untuk integrasi data pertama Anda menggunakan Data Factory di Microsoft Fabric, Anda belajar cara:

  • Buat jalur pemrosesan data.
  • Tambahkan aktivitas Salin ke alur Anda.
  • Gunakan data sampel dan buat data Lakehouse untuk menyimpan data ke tabel baru.
  • Jalankan alur dan lihat detail dan perincian durasinya.

Lanjutkan ke bagian berikutnya sekarang untuk membuat aliran data Anda.