Apa pekerjaan Salin (pratinjau) di Data Factory untuk Microsoft Fabric
Data Factory in Fabric memberdayakan pengguna untuk mengintegrasikan data dengan mulus dari lebih dari 100 konektor bawaan - baik sumber maupun tujuan - melalui antarmuka yang intuitif secara visual. Aktivitas Salin, bekerja dalam alur data, memfasilitasi penyerapan data. Sementara itu, Dataflow Gen2 mendukung transformasi data, dan alur mengatur alur integrasi.
Keuntungan dari pekerjaan Salin
Meskipun aktivitas Salin dalam alur data menangani penyerapan data dengan operasi massal/batch, membuat alur data di Data Factory masih terbukti menantang bagi banyak pengguna yang baru di bidang tersebut, dengan kurva pembelajaran yang curam. Jadi, kami senang memperkenalkan pekerjaan Salin, meningkatkan pengalaman penyerapan data ke proses yang lebih efisien dan mudah digunakan dari sumber apa pun ke tujuan mana pun. Sekarang, menyalin data Anda lebih mudah daripada sebelumnya. Selain itu, Pekerjaan salin mendukung berbagai gaya pengiriman data, termasuk salinan batch dan salinan bertahap, menawarkan fleksibilitas untuk memenuhi kebutuhan spesifik Anda.
Beberapa keuntungan dari pekerjaan Salin daripada metode pergerakan data lainnya meliputi:
- Pengalaman Intuitif: Rasakan penyalinan data yang mulus tanpa kompromi, membuatnya lebih mudah dari sebelumnya.
- Efisiensi: Aktifkan penyalinan bertahap dengan mudah, mengurangi intervensi manual. Efisiensi ini diterjemahkan ke pemanfaatan sumber daya yang lebih sedikit dan durasi penyalinan yang lebih cepat.
- Fleksibilitas: Meskipun menikmati kesederhanaan, Anda juga memiliki fleksibilitas untuk mengontrol pergerakan data Anda. Pilih tabel dan kolom mana yang akan disalin, petakan data, tentukan perilaku baca/tulis, dan atur jadwal yang sesuai dengan kebutuhan Anda, baik untuk tugas satu kali atau operasi berulang.
- Performa yang kuat: Pengaturan tanpa server yang memungkinkan transfer data dengan paralelisme skala besar, memaksimalkan throughput pergerakan data untuk sistem Anda.
Konektor yang didukung
Saat ini, Anda dapat menggunakan pekerjaan Salin untuk transfer data cloud atau menyalin data dari penyimpanan data lokal melalui gateway. Pekerjaan Salin mendukung penyimpanan data berikut sebagai sumber dan tujuan:
- Azure SQL DB
- SQL Server lokal
- Gudang Fabric
- Fabric Lakehouse
- Amazon S3
- Azure Data Lake Storage Gen2
- Azure Blob Storage
- Amazon RDS untuk SQL Server
Tim produk sedang menjelajahi dukungan konektor lebih lanjut, jadi nantikan pembaruan.
Perilaku menyalin
Anda dapat memilih dari gaya pengiriman data berikut.
- Mode penyalinan penuh: Setiap pekerjaan penyalinan berjalan menyalin semua data dari sumber ke tujuan sekaligus.
- Mode penyalinan bertahap: Pekerjaan awal menjalankan menyalin semua data, dan pekerjaan berikutnya hanya menjalankan salin perubahan sejak eksekusi terakhir. Data yang diubah ditambahkan ke penyimpanan tujuan Anda.
Anda juga dapat memilih bagaimana data ditulis ke penyimpanan tujuan Anda.
Secara default, Copy Job menambahkan data ke tujuan Anda, sehingga Anda tidak akan melewatkan riwayat perubahan apa pun. Tapi, Anda juga dapat menyesuaikan perilaku tulis dengan upsert atau overwrite.
- Saat menyalin data ke penyimpanan penyimpanan: Baris baru dari tabel atau file disalin ke file baru di tujuan. Jika file dengan nama yang sama sudah ada di penyimpanan target, file tersebut akan ditimpa.
- Saat menyalin data ke database: Baris baru dari tabel atau file ditambahkan ke tabel tujuan. Anda dapat mengubah perilaku tulis menjadi upsert (di SQL DB atau SQL Server) atau menimpa (pada tabel Fabric Lakehouse).
Kolom inkremental
Dalam mode penyalinan bertahap, Anda harus memilih kolom bertahap untuk setiap tabel untuk mengidentifikasi perubahan. Copy Job menggunakan kolom ini sebagai marka air, membandingkan nilainya dengan yang sama dari eksekusi terakhir untuk menyalin data baru atau yang diperbarui saja. Kolom bertambah bertahap harus berupa tanda waktu atau INT yang meningkat.
Ketersediaan wilayah
Pekerjaan Salin memiliki ketersediaan regional yang sama dengan alur.
Harga
Pekerjaan Salin menggunakan pengukur penagihan yang sama: Pergerakan Data, dengan tingkat konsumsi yang identik.