Získanie údajov zo služby OneLake
V tomto článku sa naučíte, ako získať údaje z OneLakeu do novej alebo existujúcej tabuľky.
Predpoklady
- pracovného priestoru
s kapacitou podporujúcich službu Microsoft Fabric -
Lakehouse - Databáza KQL s povoleniami na úpravu
Kopírovať cestu k súboru z Lakehouse
Z pracovného priestoru vyberte prostredie Lakehouse obsahujúce zdroj údajov, ktorý chcete použiť.
Umiestnite kurzor na požadovaný súbor a vyberte ponuku Ďalšie (...) a potom vyberte Vlastnosti.
Dôležitý
- Cesty k priečinku nie sú podporované.
- Zástupné znaky (*) nie sú podporované.
V časti
URLvyberte ikonu Kopírovať do Schránky a uložte ju na miesto, kde ju môžete načítať v neskoršom kroku.Vráťte sa do svojho pracovného priestoru a vyberte databázu KQL.
Zdroj
Na dolnom páse s nástrojmi databázy KQL vyberte položky Získať údaje.
V okne
Získať údaje je vybratá kartaSource (Získať údaje).Zo zoznamu k dispozícii vyberte zdroj údajov. V tomto príklade ingestujete údaje zo OneLake.
Konfigurovať
Vyberte cieľovú tabuľku. Ak chcete ingestovať údaje do novej tabuľky, vyberte položky +Nová tabuľka a zadajte názov tabuľky.
Nota
Názvy tabuliek môžu mať maximálne 1 024 znakov vrátane medzier, alfanumerických znakov, spojovoviek a znakov podčiarknutia. Špeciálne znaky nie sú podporované.
V súbor OneLake, prilepte cestu k súboru lakehouse ste skopírovali v Kopírovať cestu k súboru z Lakehouse.
Nota
Ku každej položke môžete pridať až 10 položiek s veľkosťou až 1 GB.
Vyberte položky Ďalšie.
Skontrolovať
Otvorí sa karta Skontrolovať s ukážkou údajov.
Proces príjmu dokončíte výberom položky Dokončiť.
Voliteľne:
- Výberom položky Command Viewer (Zobrazovač príkazov) zobrazte a skopírujte automatické príkazy vygenerované z vašich vstupov.
- Pomocou rozbaľovacieho zoznamu definície Schema môžete zmeniť súbor, z ktorému je schéma odvodená.
- Automaticky odvodený formát údajov môžete zmeniť výberom požadovaného formátu z rozbaľovacieho zoznamu. Ďalšie informácie nájdete v téme Formáty údajov podporované Real-Time intelligence.
- Úprava stĺpcov.
- Preskúmajte rozšírené možnosti na základe typu údajov.
Úprava stĺpcov
Nota
- V prípade tabuľkových formátov (CSV, TSV, PSV) nie je možné priradiť stĺpec dvakrát. Ak chcete priradiť k existujúcemu stĺpcu, najskôr odstráňte nový stĺpec.
- Nemôžete zmeniť existujúci typ stĺpca. Ak sa pokúsite priradiť stĺpec, ktorý má iný formát, pravdepodobne budete mať prázdne stĺpce.
Zmeny, ktoré môžete vykonať v tabuľke, závisia od nasledujúcich parametrov:
- typ tabuľky je nový alebo existujúci
- Priradenie typ je nový alebo existujúci
Typ tabuľky | Typ mapovania | Dostupné úpravy |
---|---|---|
Nová tabuľka | Nové priradenie | Premenovanie stĺpca, zmena typu údajov, zmena zdroja údajov, priradenie transformácie, pridanie stĺpca, odstránenie stĺpca |
Existujúca tabuľka | Nové priradenie | Pridať stĺpec (v ktorom môžete potom zmeniť typ údajov, premenovať a aktualizovať) |
Existujúca tabuľka | Existujúce priradenie | žiadny |
Transformácie mapovania
Niektoré priradenia formátov údajov (Parquet, JSON a Avro) podporujú jednoduché transformácie času ingestu. Ak chcete použiť transformácie priradenia, vytvorte alebo aktualizujte stĺpec v okne Upraviť stĺpce.
Transformácie mapovania možno vykonať v stĺpci typu reťazec alebo dátum a čas, pričom zdroj má typ údajov int alebo long. Podporované transformácie mapovania sú:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Rozšírené možnosti na základe typu údajov
Tabular (CSV, TSV, PSV):
Ak pri ingestovaní tabuľkových formátov v existujúcej tabuľke, môžete vybrať Rozšírené>Zachovať schému tabuľky. Tabuľkové údaje nemusia nevyhnutne obsahovať názvy stĺpcov, ktoré sa používajú na priradenie zdrojových údajov k existujúcim stĺpcom. Keď je táto možnosť začiarknuté, priradenie sa vykoná podľa poradia a schéma tabuľky zostáva rovnaká. Ak táto možnosť nezačiarknete, na prichádzajúce údaje sa vytvoria nové stĺpce bez ohľadu na štruktúru údajov.
Ak chcete použiť prvý riadok ako názvy stĺpcov, vyberte položky Rozšírené>Prvý riadok je hlavička stĺpca.
JSON:
Ak chcete určiť delenie údajov JSON v stĺpci, vyberte položku Rozšírené>vnorené úrovne, od 1 do 100.
Ak vyberiete položku Rozšírené>Riadky JSON s chybami, údaje sa prejdú vo formáte JSON. Ak toto políčko začiarknete začiarknuté, údaje sa ingestujú vo formáte multijson.
Súhrn
V okne Príprava údajov sú všetky tri kroky označené zelenými značkami začiarknutia pri úspešnom dokončení príjmu údajov. Kartu môžete vybrať na dotazovanie, zrušenie prijatia údajov alebo zobrazenie tabule súhrnu príjmu.