Zdieľať cez


Kopírovanie údajov pomocou kopírovania aktivity

V kanáli údajov môžete použiť aktivitu Kopírovať na kopírovanie údajov medzi úchytmi údajov umiestnenými v cloude.

Po skopírovaní údajov môžete použiť iné aktivity na ďalšiu transformáciu a analýzu údajov. Aktivitu kopírovania môžete použiť aj na publikovanie výsledkov transformácie a analýzy pre Analytické nástroje (BI) a spotrebu aplikácie.

Ak chcete kopírovať údaje zo zdroja do cieľa, služba, ktorá spúšťa aktivitu Kopírovať, vykoná tieto kroky:

  1. Číta údaje zo zdrojového úložiska údajov.
  2. Vykoná serializáciu/deserializáciu, kompresiu/dekompresiu, mapovanie stĺpcov a podobne. Vykonáva tieto operácie na základe konfigurácie.
  3. Zapíše údaje do cieľového úložiska údajov.

Požiadavky

Na začiatok musíte splniť nasledujúce predpoklady:

  • konto nájomníka služby Microsoft Fabric s aktívnym predplatným, Vytvorte si bezplatné konto.

  • Uistite sa, že máte povolený pracovný priestor služby Microsoft Fabric.

Pridanie aktivity kopírovania pomocou asistenta kopírovania

Postupujte podľa týchto krokov a nastavte svoju aktivitu kopírovania pomocou asistenta kopírovania.

Začíname s asistentom kopírovania

  1. Otvorte existujúci údajový kanál alebo vytvorte nový údajový kanál.

  2. Začnite výberom položky Kopírovať údaje na plátne a otvorte nástroj Kopírovať asistenta . Alebo vyberte položku Použiť asistenta kopírovania z rozbaľovacieho zoznamu Kopírovať údaje na karte Aktivity na páse s nástrojmi.

    Snímka obrazovky zobrazujúca možnosti na otvorenie asistenta kopírovania.

Konfigurácia zdroja

  1. Vyberte typ zdroja údajov z kategórie. Ako príklad použijete ukladací priestor objektu BLOB platformy Azure. Vyberte položku Azure Blob Storage a potom vyberte položku Ďalej.

    Snímka obrazovky znázorňujúca obrazovku Výber zdroja údajov.

  2. Výberom položky Vytvoriť nové pripojenie vytvorte pripojenie k zdroju údajov.

    Snímka obrazovky zobrazujúca miesto, kde vybrať Nové pripojenie.

    Po výbere možnosti Vytvoriť nové pripojenie vyplňte požadované informácie o pripojení a potom vyberte položku Ďalej. Podrobnosti o vytváraní pripojenia pre jednotlivé typy zdrojov údajov nájdete v článku o jednotlivých konektoroch.

    Ak máte existujúce pripojenia, môžete vybrať položku Existujúce pripojenie a z rozbaľovacieho zoznamu vybrať pripojenie.

    Snímka obrazovky zobrazujúca existujúce pripojenie.

  3. Vyberte súbor alebo priečinok, ktoré sa má kopírovať v tomto kroku konfigurácie zdroja, a potom vyberte položku Ďalej.

    Snímka obrazovky znázorňujúca miesto, kam sa majú vybrať údaje, ktoré sa majú skopírovať.

Konfigurácia cieľa

  1. Vyberte typ zdroja údajov z kategórie. Ako príklad použijete ukladací priestor objektu BLOB platformy Azure. Môžete vytvoriť nové pripojenie, ktoré odkazuje na nové konto úložiska objektu Blob platformy Azure pomocou krokov uvedených v predchádzajúcej časti, alebo použiť existujúce pripojenie z rozbaľovacieho zoznamu pripojenia. Možnosti Testovať pripojenie a Upraviť sú k dispozícii pre každé vybraté pripojenie.

    Snímka obrazovky zobrazujúca, ako vybrať ukladací priestor objektu BLOB platformy Azure.

  2. Nakonfigurujte a priraďte svoje zdrojové údaje k cieľu. Potom výberom položky Ďalej dokončite cieľové konfigurácie.

    Snímka obrazovky mapy k cieľovej obrazovke.

    Snímka obrazovky znázorňujúca pripojenie k cieľu údajov.

    Poznámka

    V rámci tej istej aktivity kopírovania môžete použiť len jednu lokálnu bránu údajov. Ak sú zdroje aj údaje typu sink lokálne, musia používať rovnakú bránu. Ak chcete presúvať údaje medzi lokálnymi zdrojmi údajov s rôznymi bránami, musíte skopírovať prvú bránu do stredného cloudového zdroja v rámci jednej aktivity kopírovania. Potom môžete použiť inú aktivitu kopírovania a skopírovať ju zo zdroja stredného cloudu pomocou druhej brány.

Kontrola a vytvorenie aktivity kopírovania

  1. Skontrolujte nastavenia aktivity kopírovania v predchádzajúcich krokoch a výberom tlačidla OK dokončite kroky. Prípadne sa môžete vrátiť k predchádzajúcim krokom a v prípade potreby upraviť nastavenia v nástroji.

    Snímka obrazovky s obrazovkou Skontrolovať a vytvoriť.

Po dokončení sa aktivita kopírovania pridá na plátno kanála údajov. Všetky nastavenia vrátane rozšírených nastavení tejto aktivity kopírovania sú po výbere k dispozícii na kartách.

Snímka obrazovky znázorňujúca aktivitu kopírovania na plátne kanála údajov.

Teraz môžete buď uložiť dátový kanál pomocou tejto aktivity jednej kópie, alebo pokračovať v navrhovaní kanála údajov.

Pridanie aktivity kopírovania priamo

Ak chcete pridať aktivitu kopírovania priamo, postupujte podľa týchto krokov.

Pridanie aktivity kopírovania

  1. Otvorte existujúci údajový kanál alebo vytvorte nový údajový kanál.

  2. Pridajte aktivitu kopírovania výberom položky Pridať aktivitu>kanála Kopírovať aktivitu alebo výberom položky Kopírovať údaje>Pridať na plátno na karte Aktivity.

    Snímka obrazovky znázorňujúca dva spôsoby, ako pridať aktivitu kopírovania.

Konfigurácia všeobecných nastavení na karte Všeobecné

Informácie o konfigurácii všeobecných nastavení nájdete v téme Všeobecné.

Nakonfigurujte zdroj na karte Zdroj

  1. Vyberte položku + Nové vedľa pripojenia a vytvorte pripojenie k zdroju údajov.

    Snímka obrazovky zobrazujúca miesto, kde vybrať položku Nové.

    1. V kontextovom okne vyberte typ zdroja údajov. Ako príklad použijete databázu Azure SQL. Vyberte položku Databáza Azure SQL a potom položku Pokračovať.

      Snímka obrazovky zobrazujúca spôsob výberu zdroja údajov.

    2. Prejde na stránku na vytvorenie pripojenia. Vyplňte požadované informácie o pripojení na paneli a potom vyberte položku Vytvoriť. Podrobnosti o vytváraní pripojenia pre jednotlivé typy zdrojov údajov nájdete v článku o jednotlivých konektoroch.

      Snímka obrazovky zobrazujúca stránku s novým pripojením.

    3. Po úspešnom vytvorení pripojenia sa vrátite na stránku kanála údajov. Potom vyberte položku Obnoviť , čím sa z rozbaľovacieho zoznamu načíta pripojenie, ktoré ste vytvorili. Môžete tiež vybrať existujúce pripojenie k databáze Azure SQL z rozbaľovacieho zoznamu priamo, ak ste ho už vytvorili predtým. Možnosti Testovať pripojenie a Upraviť sú k dispozícii pre každé vybraté pripojenie. Potom v časti Typ pripojenia vyberte možnosť Databáza Azure SQL.

      Snímka obrazovky znázorňujúca miesto obnovenia pripojenia.

  2. Zadajte tabuľku, ktorá sa má skopírovať. Ak chcete zobraziť ukážku zdrojovej tabuľky, vyberte položku Zobraziť ukážku údajov . Na čítanie údajov zo zdroja môžete použiť aj procedúru Dotaz a uloženú.

    Snímka obrazovky zobrazujúca možnosti nastavení zdrojovej tabuľky.

  3. Rozbaľte ponuku Rozšírené , aby ste zobrazili pokročilejšie nastavenia.

    Snímka obrazovky s rozšírenými nastaveniami.

Konfigurácia cieľa na cieľovej karte

  1. Vyberte cieľový typ. Môže ísť o interný ukladací priestor údajov prvej triedy z vášho pracovného priestoru, ako je napríklad Lakehouse, alebo vaše externé ukladací priestor údajov. Ako príklad použijete Lakehouse.

    Snímka obrazovky zobrazujúca miesto, kde vybrať cieľový typ.

  2. Vyberte si, či chcete použiť lakehouse v type ukladacieho priestoru údajov pracovného priestoru. Vyberte položku + Nové a prejdete na stránku vytvorenia Lakehouse. Zadajte názov svojho jazera a potom vyberte položku Vytvoriť.

    Snímka obrazovky zobrazujúca vytvorenie lokality Lakehouse.

  3. Po úspešnom vytvorení pripojenia sa vrátite na stránku kanála údajov. Potom vyberte položku Obnoviť , čím sa z rozbaľovacieho zoznamu načíta pripojenie, ktoré ste vytvorili. Môžete si tiež vybrať existujúce pripojenie k Lakehouse z rozbaľovacieho zoznamu priamo, ak ste ho už predtým vytvorili.

    Snímka obrazovky zobrazujúca výber pripojenia.

  4. Zadajte tabuľku alebo nastavte cestu k súboru na definovanie súboru alebo priečinka ako cieľa. Tu vyberte položku Tabuľky a zadajte tabuľku, ktorá sa má zapisovať údaje.

    Snímka obrazovky znázorňujúca, kde sa majú vyhľadať nastavenia tabuľky.

  5. Rozbaľte ponuku Rozšírené , aby ste zobrazili pokročilejšie nastavenia.

    Snímka obrazovky s rozšírenými možnosťami.

Teraz môžete buď uložiť dátový kanál pomocou tejto aktivity jednej kópie, alebo pokračovať v navrhovaní kanála údajov.

Konfigurácia priradení na karte priradenia

Ak konektor, ktorý používate, podporuje mapovanie, môžete prejsť na kartu Mapovanie a konfigurovať priradenie.

  1. Ak chcete importovať schému údajov, vyberte položku Importovať schémy.

    Snímka obrazovky s nastaveniami mapovania 1.

  2. Môžete vidieť, že sa zobrazuje automatické mapovanie. Zadajte stĺpce Source (Zdroj ) a Destination (Cieľ ). Ak vytvoríte novú tabuľku v cieli, môžete prispôsobiť názov stĺpca Cieľ tu. Ak chcete zapísať údaje do existujúcej cieľovej tabuľky, nemôžete upraviť existujúci názov stĺpca Cieľ . Môžete tiež zobraziť stĺpce Typ zdroja a cieľa.

    Snímka obrazovky s nastaveniami mapovania 2.

Okrem toho môžete vybrať + Nové priradenie a pridať nové priradenie, výberom položky Vymazať vymažete všetky nastavenia mapovania a potom vyberte položku Obnoviť, čím obnovíte všetky zdrojové stĺpce priradenia.

Konfigurácia ďalších nastavení na karte Nastavenia

Karta Nastavenia obsahuje nastavenia výkonu, pracovnej verzie a podobne.

Snímka obrazovky s kartou Nastavenia.

Popis jednotlivých nastavení nájdete v nasledujúcej tabuľke.

Nastavenie Description Vlastnosť skriptu JSON
Inteligentná optimalizácia priepustnosť Zadajte hodnotu na optimalizáciu priepustnosť. Môžete si vybrať z nasledovného:
Automatické
Štandardné
Vyvážené
Maximum

Ak vyberiete možnosť Automaticky, optimálne nastavenie sa použije dynamicky na základe dvojice zdroja – cieľa a vzoru údajov. Priepustnosť môžete tiež prispôsobiť a vlastná hodnota môže byť 2 – 256, zatiaľ čo vyššia hodnota znamená viac ziskov.
dataIntegrationUnits (množiny údajov)
Stupeň paralelného kopírovania Zadajte stupeň paralelného spracovávania, ktorý by sa použil pri načítavaní údajov. paralelné kópie
Chybám Pri výbere tejto možnosti môžete ignorovať niektoré chyby, ktoré sa vyskytli uprostred procesu kopírovania. Napríklad nekompatibilné riadky medzi zdrojom a cieľovím ukladacím priestorom, odstránenie súboru počas premiestňovania údajov atď. • enableSkipIncompatibleRow
• skipErrorFile:
   fileMissing
   fileForbidden
   invalidFileName
Povoliť zapisovanie do denníka Pri výbere tejto možnosti môžete zapisovať do denníka skopírované súbory, vynechané súbory a riadky. /
Povolenie pracovnej verzie Určte, či sa majú kopírovať údaje cez dočasný ukladací priestor. Umožnenie pracovnej verzie iba pre prospešné scenáre. enableStaging (povoliť menovku)
Typ ukladacieho priestoru údajov Keď povolíte fázu, môžete ako typ ukladacieho priestoru údajov vybrať položky Pracovný priestor a Externý . /
Pre pracovný priestor
Pracovný priestor Zadajte, ak chcete použiť vstavané fázové úložisko. /
Pre externé
Pripojenie konta pracovnej verzie Zadajte pripojenie úložiska Azure Blob Storage alebo Azure Data Lake Storage Gen2, ktoré odkazuje na inštanciu úložiska, ktoré používate ako dočasný ukladací priestor. Ak ho nemáte, vytvorte fázové pripojenie. connection (v časti externalReferences)
Cesta k úložisku Zadajte cestu, ktorá má obsahovať fázové údaje. Ak neposkytnete cestu, služba vytvorí kontajner na uloženie dočasných údajov. Cestu zadajte iba vtedy, ak používate úložisko s podpisom zdieľaného prístupu alebo ak potrebujete, aby sa dočasné údaje nachádzali na konkrétnom mieste. cesta
Povoliť kompresiu Určuje, či sa údaje majú komprimovať predtým, ako sa skopírujú do cieľa. Toto nastavenie znižuje objem prenášaných údajov. enableCompression
Zachovať Zadajte, či sa majú zachovať metaúdaje/zoznamy ACL počas kopírovania údajov. zachovať

Poznámka

Ak použijete fázovú kópiu s povolenou kompresiou, overovanie objektom služby pre fázové pripojenie objektu BLOB nie je podporované.

Konfigurácia parametrov v kopírovanej aktivite

Parametre možno použiť na ovládanie správania kanála a jeho aktivít. Vlastnosť Add dynamic content (Pridať dynamický obsah) môžete použiť na určenie parametrov pre vlastnosti kopírovanej aktivity. Ako príklad uvádzame určenie lakehouse/skladu údajov/databázy KQL.

  1. Vo svojom zdroji alebo cieli vyberte ako typ ukladacieho priestoru údajov položku Pracovný priestor a ako typ úložiska údajov Lakehouse/Data Warehouse/KQL vyberte možnosť Pridať dynamický obsah v rozbaľovacom zozname služby Lakehouse alebo Data Warehouse alebo KQL Database.

  2. V kontextovom okne Pridajte tablu s dynamickým obsahom na karte Parametre vyberte položku +.

    Snímka obrazovky zobrazujúca stránku Pridať dynamický obsah.

  3. Zadajte názov parametra a podľa potreby zadajte predvolenú hodnotu, alebo môžete po výbere položky Spustiť v kanáli zadať hodnotu parametra.

    Snímka obrazovky znázorňuje vytvorenie nového parametra.

    Všimnite si, že hodnota parametra by mala byť Lakehouse/Data Warehouse/KQL Database object ID. Ak chcete získať ID objektu Lakehouse,Data Warehouse/KQL Database, v pracovnom priestore otvorte databázu Lakehouse/Data Warehouse/KQL a ID sa nachádza po /lakehouses/alebo /datawarehouses/ /databases/ v URL adrese.

    • ID objektu Lakehouse:

      Snímka obrazovky zobrazujúca ID objektu Lakehouse.

    • ID objektu skladu údajov:

      Snímka obrazovky zobrazujúca ID objektu skladu údajov.

    • ID objektu databázy KQL:

      Snímka obrazovky zobrazujúca ID objektu databázy KQL.

  4. Výberom položky Uložiť sa vráťte na tablu Pridať dynamický obsah . Potom vyberte parameter, aby sa zobrazoval v poli výrazu. Potom vyberte OK. Vrátite sa na stránku kanála a môžete vidieť, že výraz parametra je zadaný po objekte Lakehouse object ID/object Warehouse ID/KQL Database ID objektu.

    Snímka obrazovky zobrazujúca výber parametra.