Del via


Hvad er kopijobbet (prøveversion) i Data Factory til Microsoft Fabric

Data Factory i Fabric giver brugerne mulighed for problemfrit at integrere data fra mere end 100 indbyggede connectors – både kilder og destinationer – via en visuelt intuitiv grænseflade. Kopieringsaktiviteten, der arbejder i datapipelines, letter dataindtagelse. I mellemtiden understøtter Dataflow Gen2 datatransformationer, og pipelines organiserer integrationsflowet.

Fordele ved kopijobbet

Mens kopieringsaktiviteten i datapipelines håndterer dataindtagelse med masse-/batchhandlinger, viser det sig stadig, at oprettelse af datapipelines i Data Factory kan udfordres for mange brugere, der er nye i marken, med en mere stejl læringskurve. Så vi er glade for at kunne introducere kopijobbet, der hæver dataindtagelsesoplevelsen til en mere strømlinet og brugervenlig proces fra enhver kilde til en hvilken som helst destination. Det er nu nemmere end nogensinde før at kopiere dine data. Kopieringsjobbet understøtter desuden forskellige dataleveringstypografier, herunder både batchkopi og trinvis kopi, der giver fleksibilitet til at imødekomme dine specifikke behov.

Skærmbillede, der viser kopijobbet og resultatruden.

Nogle af fordelene ved kopijobbet i forhold til andre metoder til dataflytning omfatter:

  • Intuitiv oplevelse: Oplev problemfri kopiering af data uden kompromiser, hvilket gør det nemmere end nogensinde før.
  • Effektivitet: Aktivér trinvis kopiering uden besvær, hvilket reducerer manuel indgriben. Denne effektivitet betyder mindre ressourceudnyttelse og hurtigere kopieringsvarighed.
  • Fleksibilitet: Mens du nyder enkeltheden, har du også fleksibiliteten til at styre din databevægelse. Vælg, hvilke tabeller og kolonner der skal kopieres, knyt dataene, definer læse-/skrivefunktionsmåden, og angiv tidsplaner, der passer til dine behov, uanset om det er en engangsopgave eller tilbagevendende handling.
  • Robust ydeevne: En serveruafhængig konfiguration, der muliggør dataoverførsel med storstilet parallelitet, hvilket maksimerer dataflytningsoverførselshastigheden for dit system.

Understøttede connectors

I øjeblikket kan du bruge kopijobbet til overførsel af clouddata eller kopiering af data fra et datalager i det lokale miljø via gatewayen. Kopijobbet understøtter følgende datalagre som både kilde og destination:

  • Azure SQL DB
  • Oracle
  • SQL Server i det lokale miljø
  • Fabric Warehouse
  • Fabric Lakehouse
  • Amazon S3
  • Azure Data Lake Storage Gen2
  • Azure Blob Storage
  • Azure SQL MI
  • Snowflake
  • Azure Synapse Analytics
  • Azure Data Explorer
  • Azure PostgreSQL
  • Google Cloud Storage
  • MySQL
  • Azure MySQL

Bemærk!

  • Nogle connectors understøtter endnu ikke trinvis kopiering, men de vil snart være tilgængelige.
  • Produktteamet udforsker hurtigt mere connectorsupport, så holde øje med opdateringer.

Funktionsmåde for kopiering

Du kan vælge mellem følgende dataleveringstypografier.

  • Fuld kopieringstilstand: Hvert kopijob, der køres, kopierer alle data fra kilden til destinationen på én gang.

  • Trinvis kopieringstilstand: Det indledende job, der køres, kopierer alle data, og efterfølgende job kører kun kopiering af ændringer siden sidste kørsel. De ændrede data føjes til destinationslageret.

    Bemærk!

    Tilstanden Trinvis kopiering er stadig i prøveversion, men vil snart være offentlig tilgængelig.

Du kan også vælge, hvordan data skal skrives til din destinationsbutik.

Kopiér job føjer som standard data til destinationen, så du ikke går glip af nogen ændringsoversigt. Men du kan også justere opdateringsmetoden for at flette eller overskrive. Når du udfører en fletning, skal du angive en nøglekolonne. Den primære nøgle bruges som standard, hvis den er.

  • Når du kopierer data til lagerlageret: Nye rækker fra tabellerne eller filerne kopieres til nye filer i destinationen. Hvis der allerede findes en fil med samme navn i destinationslageret, overskrives den.
  • Når du kopierer data til databasen: Nye rækker fra tabellerne eller filerne føjes til destinationstabeller. Du kan ændre opdateringsmetoden til at flette (på SQL DB eller SQL Server) eller overskrive (på Fabric Lakehouse-tabeller).

Trinvis kolonne

I tilstanden Trinvis kopiering skal du vælge en trinvis kolonne for hver tabel for at identificere ændringer. Kopiér job bruger denne kolonne som et vandmærke og sammenligner dens værdi med det samme fra sidste kørsel for kun at kopiere de nye eller opdaterede data. Den trinvise kolonne skal være et tidsstempel eller en stigende INT.

Regiontilgængelighed

Kopijobbet har samme regionale tilgængelighed som pipelinen.

Prisfastsættelse

Kopijobbet bruger den samme faktureringsmåler: Dataflytning med en identisk forbrugshastighed.