Formát ORC v službe Data Factory v službe Microsoft Fabric
Tento článok popisuje konfiguráciu formátu ORC v kanáli údajov služby Data Factory v službe Microsoft Fabric.
Podporované schopnosti
Formát ORC je podporovaný pre nasledujúce aktivity a konektory ako zdroj a cieľ.
Kategória | Konektor/aktivita |
---|---|
Podporovaný konektor | Amazon S3 |
Amazon S3 Kompatibilné | |
Ukladací priestor objektov BLOB na platforme Azure | |
Azure Data Lake Storage 1. generácie | |
Azure Data Lake Storage Gen2 | |
Súbory Azure | |
Systém súborov | |
FTP | |
Google Cloud Storage | |
HTTP (http) | |
Lakehouse Files | |
Oracle Cloud Storage | |
SFTP | |
Podporovaná aktivita | Kopírovať aktivitu (zdroj/cieľ) |
Aktivita vyhľadávania | |
Aktivita GetMetadata | |
Odstránenie aktivity údajov |
Formát ORC v kopírovanej aktivite
Ak chcete nakonfigurovať formát ORC, vyberte pripojenie v zdroji alebo cieli aktivity kopírovania kanála údajov a potom v rozbaľovacom zozname Formát súboru vyberte položku ORC. Vyberte položku Nastavenia pre ďalšiu konfiguráciu tohto formátu.
Formát ORC ako zdroj
Po výbere položky Nastavenia v časti Formát súboru sa v kontextovom okne Nastavenia formátu súboru zobrazia nasledujúce vlastnosti.
- Typ kompresie: Vyberte kompresný kodek používaný na čítanie súborov ORC v rozbaľovacom zozname. Môžete si vybrať možnosť None (Žiadne), zlib (zlib) alebo snappy (prichytenie).
Formát ORC ako cieľ
Po výbere položky Nastavenia sa v kontextovom okne Nastavenia formátu súboru zobrazia nasledujúce vlastnosti.
- Typ kompresie: Vyberte kompresný kodek používaný na zápis súborov ORC v rozbaľovacom zozname. Môžete si vybrať možnosť None (Žiadne), zlib (zlib) alebo snappy (prichytenie).
V časti Rozšírené nastavenia na karte Cieľ sa zobrazujú nasledujúce súvisiace vlastnosti formátu ORC.
- Maximálny počet riadkov na súbor: Pri písaní údajov do priečinka môžete vybrať možnosť zapisovania do viacerých súborov a určenia maximálnych riadkov na súbor. Zadajte maximálny počet riadkov, ktoré chcete na súbor zapísať.
- Predpona názvu súboru: Použiteľné, keď je nakonfigurovaný maximálny počet riadkov na súbor . Pri písaní údajov do viacerých súborov zadajte predponu názvu súboru, výsledkom čoho bude tento vzor:
<fileNamePrefix>_00000.<fileExtension>
. Ak parameter nie je zadaný, automaticky sa vygeneruje predpona názvu súboru. Táto vlastnosť sa nevzťahuje, keď je zdrojom súbor na báze úložiska alebo oblasti povoleného úložiska údajov.
Súhrn tabuľky
ORC ako zdroj
Pri používaní formátu ORC sú v časti Zdroj aktivity kopírovania podporované nasledujúce vlastnosti.
Názov | Popis | Value | Požaduje sa | Vlastnosť skriptu JSON |
---|---|---|---|---|
Formát súboru | Formát súboru, ktorý chcete použiť. | ORC | Áno | type (under datasetSettings ):Orc |
Typ kompresie | Kompresný kodek slúžiaci na čítanie súborov ORC. | Žiadny zlib Elegantné |
No | orcCompressionCodec: žiadne zlib Elegantné |
ORC ako cieľ
Pri použití formátu ORC sú v časti Cieľ aktivity kopírovania podporované nasledujúce vlastnosti.
Názov | Popis | Value | Požaduje sa | Vlastnosť skriptu JSON |
---|---|---|---|---|
Formát súboru | Formát súboru, ktorý chcete použiť. | ORC | Áno | type (under datasetSettings ):Orc |
Typ kompresie | Kompresný kodek slúžiaci na zápis súborov ORC. | Žiadny zlib Elegantné |
No | orcCompressionCodec: žiadne zlib Elegantné |
Maximálny počet riadkov na súbor | Pri zapisovaní údajov do priečinka môžete vybrať možnosť zapisovania do viacerých súborov a určenia maximálneho počtu riadkov na súbor. Zadajte maximálny počet riadkov, ktoré chcete na súbor zapísať. | <maximálny počet riadkov na súbor> | No | maxRowsPerFile |
Predpona názvu súboru | Vhodné, ak je nakonfigurovaný maximálny počet riadkov na súbor . Pri písaní údajov do viacerých súborov zadajte predponu názvu súboru, výsledkom čoho bude tento vzor: <fileNamePrefix>_00000.<fileExtension> . Ak parameter nie je zadaný, automaticky sa vygeneruje predpona názvu súboru. Táto vlastnosť sa nevzťahuje, keď je zdrojom súbor na báze úložiska alebo oblasti povoleného úložiska údajov. |
<predpona názvu súboru> | No | fileNamePrefix |