Konfigurácia SFTP do kopírovanej aktivity
Tento článok popisuje, ako použiť aktivitu kopírovania v kanáli údajov na kopírovanie údajov z SFTP.
Podporovaný formát
SFTP podporuje nasledujúce formáty súborov. V každom článku nájdete informácie o nastaveniach založených na formáte.
- formátu
Avro - binárneho formátu
- formát textu s oddeľovačmi
- formátu Excelu
- formátu JSON
- formátu
ORC - formátu
Parquet - formátu XML
Podporovaná konfigurácia
Ak chcete nastaviť každú kartu v časti Aktivita kopírovania, prejdite do nasledujúcich sekcií.
- všeobecné
- zdrojové
- cieľ
- mapovania
- nastavenia
Všeobecné
Ak chcete nakonfigurovať kartu Všeobecné nastavenia
Zdroj
Prejdite na kartu Source a nakonfigurujte zdroj aktivity kopírovania. Podrobnú konfiguráciu získate v nasledujúcom obsahu.
Nasledujúce tri vlastnosti sa vyžadujú:
Typ ukladacieho priestoru údajov: vyberte položky Externý.
pripojenia: Zo zoznamu pripojení vyberte pripojenie SFTP. Ak pripojenie neexistuje, vytvorte nové pripojenie SFTP výberom položky Nový.
Typ cesty k súboru: vyberte zo zoznamu Cesta k súboru, cesta k súboru so zástupným znakom a zoznam súborov na základe toho, ako chcete čítať súbory.
Cesta k súboru: Ak vyberiete tento typ, zadajte cestu k zdrojového súboru. Môžete vybrať položky Prehľadávať a vybrať zdrojové súbory alebo zadať cestu k súboru manuálne.
Cesta k divokému súboru: Ak vyberiete tento typ, zadajte cesty k zástupným znakom na filtrovanie zdrojových priečinkov alebo súborov.
Povolené zástupné znaky sú
*
(zodpovedá nule alebo viacerým znakom) a?
(zodpovedá nule alebo jednému znaku). Ak názov priečinka obsahuje zástupný znak alebo tento escape znak vnútri, použite^
na to, aby ste sa vyhli. Ďalšie príklady nájdete v Príkladoch filtra priečinkov a súborov.Cesta k priečinku zástupných znakov: Zadajte cestu k priečinku so zástupnými znakmi na filtrovanie zdrojových priečinkov.
Názov zástupného súboru: Zadajte názov súboru so zástupnými znakmi v rámci danej cesty k priečinku/cesty zástupného znaku k filtrovaniu zdrojových súborov.
Zoznam súborov: Ak vyberiete tento typ, zadajte cestu k priečinku a cesta k zoznamu súborov označuje, že chcete skopírovať danú množinu súborov. Ukážte na textový súbor obsahujúci zoznam súborov, ktoré chcete skopírovať, jeden súbor na riadok. Ďalšie príklady nájdete v príkladoch zoznamu Súbor.
Cesta k priečinku: Zadajte cestu k zdrojového priečinku. Je to nutné.
Cesta k zoznamu súborov: Zadajte cestu textového súboru, ktorý obsahuje zoznam súborov, ktoré chcete skopírovať.
Formát súboru: V rozbaľovacom zozname vyberte použitý formát súboru. Vyberte Nastavenia
nastavenia a nakonfigurujte formát súboru. Ak chcete získať nastavenia rôznych formátov súborov, podrobné informácie nájdete v článkoch v podporovanom formáte.
V časti Rozšírenémôžete zadať nasledujúce polia:
filtrovať podľa naposledy upravených: Súbory sa filtrujú na základe naposledy upravených dátumov, ktoré ste zadali. Táto vlastnosť sa nevzťahuje na konfiguráciu typu cesty k súboru ako zoznamu súborov.
- Čas začatia (UTC): Súbory sa vyberú, ak je ich čas poslednej úpravy väčší alebo rovnaký ako nakonfigurovaný čas.
- Čas ukončenia (UTC): Súbory sa vyberú, ak je ich čas poslednej úpravy kratší ako nakonfigurovaný čas.
Ak Čas začatia (UTC) má hodnotu datetime, ale Čas ukončenia (UTC) má hodnotu NULL, znamená to, že súbory, ktorých posledný upravený atribút je väčší alebo rovnaký ako hodnota dátumu a času, je vybratý. Ak Čas ukončenia (UTC) má hodnotu dátumu a času, ale Start time (UTC) má hodnotu NULL, znamená to, že súbory, ktorých posledný upravený atribút je menší ako hodnota datetime je vybratá. Vlastnosti môžu mať hodnotu NULL, čo znamená, že na údaje sa nepoužije žiadny filter atribútu súboru.
Disable chunking: Blokovanie je navrhnuté tak, aby optimalizovalo výkon a prebieha pod ním. Táto možnosť vám umožňuje zakázať bloku údajov v jednotlivých súboroch. Pri kopírovaní údajov z SFTP sa služba najprv pokúsi získať dĺžku súboru, potom súbor rozdeliť na viaceré časti a prečítať ich paralelne. Zadajte, či váš server SFTP podporuje získavanie dĺžky súboru alebo snahu o prečítanie z určitého posunu. Predvolene nie je začiarknuté.
Povoliť zisťovanie oblasti: Zadajte, či sa majú analyzovať oblasti z cesty k súboru, a pridať ich ako nadbytočné zdrojové stĺpce. Jej výber nie je predvolene podporovaný a nepodporuje sa, keď používate formát binárneho súboru.
Koreňová cesta oblasti: Keď je povolené zisťovanie oblasti, zadajte absolútnu koreňovú cestu, aby ste mohli čítať rozdelených priečinkov ako stĺpce údajov.
Ak v predvolenom nastavení nie je zadaná,- Keď použijete cestu k súboru alebo zoznam súborov v zdroji, cesta ku koreňu oblasti je cesta, ktorú ste nakonfigurovali.
- Keď použijete filter zástupného priečinka, podprogram koreňová cesta oblasti je podprogram pred prvým zástupým znakom.
Za predpokladu, že napríklad nakonfigurujete cestu ako
root/folder/year=2020/month=08/day=27
:- Ak ako
root/folder/year=2020
zadáte koreňovú cestu oblasti, aktivita kopírovania vygeneruje ďalšie dva stĺpce za mesiac a deň s hodnotou 08 a 27 okrem stĺpcov v súboroch. - Ak nie je určená koreňová cesta oblasti, nevygeneruje sa žiadny ďalší stĺpec.
Max súbežných pripojení: Táto vlastnosť označuje hornú hranicu súbežných pripojení vytvorených s ukladacím priestorom údajov počas spustenia aktivity. Zadajte hodnotu iba vtedy, keď chcete obmedziť súbežné pripojenia.
Ďalšie stĺpce: Pridajte ďalšie stĺpce údajov na ukladanie relatívnej cesty alebo statickej hodnoty zdrojových súborov. Pre druhý sa podporuje výraz. Ďalšie informácie nájdete v Pridanie ďalších stĺpcov počas kopírovania.
Cieľ
Prejdite do časti Cieľ kartu a nakonfigurujte cieľ aktivity kopírovania. Podrobnú konfiguráciu získate v nasledujúcom obsahu.
- Typ ukladacieho priestoru údajov: vyberte položky Externý.
- pripojenia: Zo zoznamu pripojení vyberte pripojenie SFTP. Ak pripojenie neexistuje, vytvorte nové pripojenie SFTP výberom položky Nový.
- Cesta k súboru: Zadajte cestu k súboru, do čoho sa majú zapisovať údaje. Môžete vybrať položky Prehľadávať a vybrať zdrojové súbory alebo zadať cestu k súboru manuálne.
-
Formát súboru: V rozbaľovacom zozname vyberte použitý formát súboru. Vyberte Nastavenia
nastavenia a nakonfigurujte formát súboru. Ak chcete získať nastavenia rôznych formátov súborov, podrobné informácie nájdete v článkoch v podporovanom formáte.
V časti Rozšírenémôžete zadať nasledujúce polia:
Správanie pri kopírovaní: Zadajte správanie pri kopírovaní, keď je zdrojom súbory z úložiska údajov na základe súborov. Vyberte si z nasledujúcich vlastností.
- Hierarchia zjednodušenia štruktúry: Všetky súbory zo zdrojového priečinka sa nachádzajú na prvej úrovni cieľového priečinka. Cieľové súbory majú automaticky generované názvy.
- Zlúčenie súborov: Zlúči všetky súbory zo zdrojového priečinka do jedného súboru. Ak je zadaný názov súboru, zlúčený názov súboru je zadaný názov. V opačnom prípade ide o automaticky generovaný názov súboru.
- Zachovať hierarchiu (predvolené): Zachová hierarchiu súborov v cieľovom priečinku. Relatívna cesta zdrojového súboru k zdrojového priečinka je identická s relatívnou cestou cieľového súboru k cieľového priečinka.
- Pridať dynamický obsah: vyberte túto možnosť, aby ste určili správanie pri kopírovaní pomocou dynamického obsahu.
Max súbežných pripojení: Horná hranica súbežných pripojení vytvorených do ukladacieho priestoru údajov počas spustenia aktivity. Zadajte hodnotu iba vtedy, keď chcete obmedziť súbežné pripojenia.
časový limit operácie (minúty): Zadajte časový limit na písanie jednotlivých blokov na server SFTP. Predvolená hodnota je 60 minút.
Nahrať s dočasnýmsúboru: Zadajte, či chcete nahrať do dočasných súborov a premenovať ich, alebo priamo zapísať do cieľového priečinka alebo do umiestnenia súboru. Predvolene je vybratá a služba sa najprv zapíše do dočasných súborov a potom ich po dokončení nahrávania premenuje.
Táto sekvencia pomáha predchádzať konfliktom, ktoré môžu viesť k poškodeniu súboru v prípade, že do toho istého súboru zapíšete iné procesy a (2) skontrolujte, či počas prenosu existuje pôvodná verzia súboru. Ak váš server SFTP nepodporuje operáciu premenovania, túto možnosť zakážte a skontrolujte, či do cieľového súboru súčasne nezapisujete.
Tip
Ak sa zobrazí chybové hlásenie UserErrorSftpPathNotFound," "UserErrorSftpPermissionDenied" alebo "SftpOperationFail", keď píšete údaje do SFTP a používateľ SFTP, ktorý používate, má správne povolenia, skontrolujte, či váš server SFTP podporuje operáciu premenovanie súboru funguje. Ak sa tak nestane, zakážte Možnosť Nahrať s možnosťou dočasného súboru a skúste to znova.
Mapovanie
Informácie Konfigurácia kariet mapovania nájdete v téme Konfigurácia priradení na karte priradenia. Ak ako formát súboru vyberiete binárny údaj, mapovanie nebude podporované.
Nastavenia
Ak chcete Nastavenia konfigurácii karty, prejdite do Konfigurovať ďalšie nastavenia na karte Nastavenia.
Súhrn tabuľky
Nasledujúca tabuľka obsahuje ďalšie informácie o aktivite kopírovania v SFTP.
Zdroj
Meno | Popis | Hodnota | Požadovaný | Vlastnosť skriptu JSON |
---|---|---|---|---|
typ ukladacieho priestoru údajov | Typ ukladacieho priestoru údajov. | externé | Áno | / |
pripojenia | Vaše pripojenie SFTP k zdrojovému úložisku údajov. | < pripojenie SFTP > | Áno | pripojenie |
typ cesty k súboru | Typ cesty k súboru, ktorý sa používa na získanie zdrojových údajov. | • cesta k súboru • cesta k súboru zástupným znakom • zoznam súborov |
Áno | / |
cesta k súboru | Cesta k zdrojového súboru. | < cesta k súboru> | Áno | Názov_súboru folderPath |
zástupných ciest | Zástupná cesta k zdrojového súboru. | < cestu k zástupným súborom > | Áno pre názov súboru so zástupným znakom | wildcardFolderPath wildcardFileName |
cesta k priečinku | Cesta k zdrojového priečinku. | < cestu k priečinku> | Áno | folderPath |
cesta k zoznamu súborov |
Označuje skopírovanie danej množiny súborov. Ukážte na textový súbor obsahujúci zoznam súborov, ktoré chcete skopírovať, jeden súbor na riadok. | < cestu k zoznamu súborov > | Nie | fileListPath |
formátu súboru |
Formát súboru pre zdrojové údaje. Informácie o rôznych formátoch súborov nájdete v článkoch v téme Podporovaný formát, kde nájdete podrobné informácie. | / | Áno | / |
filter podľa naposledy upravených | Súbory s časom poslednej úpravy v rozsahu [Čas začatia, Čas ukončenia) sa vyfiltrujú na ďalšie spracovanie. Čas sa použije na časové pásmo UTC vo formáte yyyy-mm-ddThh:mm:ss.fffZ . Tieto vlastnosti možno vynechať, čo znamená, že sa nepoužije žiadny filter atribútu súboru. Táto vlastnosť sa nevzťahuje na konfiguráciu typu cesty k súboru ako zoznamu súborov. |
datetime (dátumu a času) | Nie | modifiedDatetimeStart modifiedDatetimeEnd |
Zakázanie bloku údajov | Blokovanie je navrhnuté tak, aby optimalizovalo výkon a vykonáva sa v dolnej časti. Táto možnosť vám umožňuje zakázať bloku údajov v jednotlivých súboroch. Pri kopírovaní údajov z SFTP sa služba najprv pokúsi získať dĺžku súboru, potom súbor rozdeliť na viaceré časti a prečítať ich paralelne. Zadajte, či váš server SFTP podporuje získavanie dĺžky súboru alebo snahu o prečítanie z určitého posunu. | vybraté alebo nevybrané (predvolené) | Nie | disableChunking: true alebo false (predvolené) |
povoliť zisťovanie oblasti | Udáva, či sa majú analyzovať oblasti z cesty k súboru, a či sa majú pridať ako nadbytočné zdrojové stĺpce. | vybraté alebo nevybrané (predvolené) | Nie | enablePartitionDiscovery: true alebo false (predvolené) |
koreňová cesta oblasti | Absolútna koreňová cesta oblasti na čítanie rozdelených priečinkov ako stĺpce údajov. Zadajte ju, keď je povolený objav oblasti. | < koreňová cesta oblasti > | Nie | partitionRootPath |
max. súbežných pripojení | Horná hranica súbežných pripojení vytvorených do ukladacieho priestoru údajov počas spustenia aktivity. Zadajte hodnotu iba vtedy, keď chcete obmedziť súbežné pripojenia. |
< vyšší limit súbežných pripojení > (celé číslo) |
Nie | maxConcurrentConnections |
ďalšie stĺpce | Pridajte ďalšie stĺpce údajov na ukladanie relatívnej alebo statickej hodnoty zdrojových súborov. Pre druhý sa podporuje výraz. Ďalšie informácie nájdete v Pridanie ďalších stĺpcov počas kopírovania | •Meno •Hodnota |
Nie | additionalColumns: •meno •hodnota |
Cieľ
Meno | Popis | Hodnota | Požadovaný | Vlastnosť skriptu JSON |
---|---|---|---|---|
typ ukladacieho priestoru údajov | Typ ukladacieho priestoru údajov. | Externý | Áno | / |
pripojenia | Vaše pripojenie k zdroju SFTP. | < pripojenie > | Áno | pripojenie |
cesta k súboru | Cesta k súboru k cieľových údajom. | Cesta k súboru cieľa | Áno | folderPath Názov_súboru |
formátu súboru |
Formát súboru pre zdrojové údaje. Informácie o rôznych formátoch súborov nájdete v článkoch v téme Podporovaný formát, kde nájdete podrobné informácie. | / | Áno | / |
správania Kopírovať | Definuje správanie pri kopírovaní, keď je zdrojom súbory z úložiska údajov na základe súborov. | • Hierarchia zjednodušenia ovládania • Zlúčenie súborov • Zachovanie hierarchie |
Nie | copyBehavior: - FlattenHierarchy – MergeFiles – PreserveHierarchy |
max. súbežných pripojení | Horná hranica súbežných pripojení vytvorených do ukladacieho priestoru údajov počas spustenia aktivity. Zadajte hodnotu iba vtedy, keď chcete obmedziť súbežné pripojenia. | < maximálny počet súbežných pripojení > | Nie | maxConcurrentConnections |
časový limit operácie (minúty) | Časový limit na písanie jednotlivých blokov na server SFTP. |
< časového limitu operácie > Predvolená hodnota je 60 |
Nie | operationTimeout (časový limit operácie) |
Nahrať s dočasným súboru | Udáva, či sa majú dočasné súbory nahrať a premenovať. Túto možnosť zakážte, ak váš server SFTP nepodporuje premenovanie operácie. | selected (predvolené) alebo nevybrané | Nie | useTempFileRename: true (predvolené) alebo false |
Súvisiaci obsah
- prehľad konektorov
SFTP.