Zdieľať cez


Možnosti na získanie údajov do služby Fabric Lakehouse

Možnosti získania údajov zahŕňajú všetky používateľské scenáre na prenos údajov do jazera, napríklad:

  • Pripojenie k existujúcemu SQL Serveru a kopírovanie údajov do tabuľky Delta na jazere.
  • Nahrávanie súborov z počítača.
  • Kopírovanie a zlúčenie viacerých tabuliek z iných domovov jazera do novej tabuľky Delta.
  • Pripojenie k zdroju streamovania na pristátie údajov v území jazera.
  • Odkazovanie na údaje bez ich skopírovania z iných interných domov jazera alebo externých zdrojov.

Rôzne spôsoby načítania údajov do jazera

V službe Microsoft Fabric existuje niekoľko spôsobov, ako získať údaje do jazera:

  • Nahrávanie súborov z lokálneho počítača
  • Spustenie nástroja na kopírovanie v kanáloch
  • Nastavenie toku údajov
  • Knižnice Apache Spark v notebookovom kóde
  • Streamovanie udalostí v reálnom čase pomocou udalosti Eventstream
  • Získanie údajov z lokality Eventhouse

Nahrávanie lokálneho súboru

Môžete tiež nahrať údaje uložené v lokálnom počítači. Môžete to urobiť priamo v Prieskumníkovi Lakehouse.

Snímka obrazovky znázorňujúca dialógové okno nahrávania súborov v prieskumníkovi Lakehouse.

Kopírovať nástroj v kanáloch

Nástroj na kopírovanie je vysoko škálovateľné riešenie integrácie údajov, ktoré vám umožňuje pripojiť sa k rôznym zdrojom údajov a načítať údaje v pôvodnom formáte alebo skonvertovať údaje na tabuľku Delta. Nástroj na kopírovanie je súčasťou aktivít kanálov, ktoré môžete upravovať rôznymi spôsobmi, napríklad plánovaním alebo spúšťaním na základe udalosti. Ďalšie informácie nájdete v téme Kopírovanie údajov pomocou kopírovania aktivity.

Toky údajov

Pre používateľov, ktorí poznajú toky údajov služby Power BI, je k dispozícii rovnaký nástroj na načítanie údajov do vášho jazera. Môžete k nemu rýchlo získať prístup z možnosti Získať údaje prieskumníka Lakehouse a načítať údaje z viac ako 200 konektorov. Ďalšie informácie nájdete v téme Rýchla konfigurácia: Vytvorenie prvého toku údajov na získanie a transformáciu údajov.

Kód poznámkového bloku

K zdroju údajov sa môžete pripojiť priamo, načítať údaje do údajového rámu a potom ich uložiť v úložiska Lakehouse. Táto metóda je najotvorenejší spôsob načítania údajov do jazera, ktorý je kód používateľa plne spravovaný.

Poznámka

Externé tabuľky Delta vytvorené pomocou kódu Spark nebudú viditeľné pre koncový bod analýzy SQL. Použite odkazy v priestore tabuľky, aby boli externé tabuľky Delta viditeľné pre koncový bod analýzy SQL. Ďalšie informácie o vytváraní odkazu nájdete v téme Vytvorenie odkazu na súbory alebo tabuľky.

Streamovanie udalostí v reálnom čase pomocou udalosti Eventstream

S eventstreamom môžete získať, spracovávať a smerovať vysoké objemy udalostí v reálnom čase zo širokej škály zdrojov.

Snímka obrazovky znázorňujúca presunutie údajov do jazera z eventstreamu.

Ak chcete zistiť, ako pridať lakehouse ako cieľ pre Eventstream, pozrite si tému Získanie údajov z Eventstreamu v úzovni Lakehouse.

Optimálny výkon streamovania dosiahnete streamovaním údajov z Eventstreamu do služby Eventhouse a následne povolíte dostupnosť služby OneLake.

Získanie údajov z lokality Eventhouse

Keď povolíte dostupnosť OneLake na údajoch v Eventhouse, v službe OneLake sa vytvorí tabuľka Delta. K tejto tabuľke Delta je možné získať prístup v lakehouse pomocou odkazu. Ďalšie informácie nájdete v téme Skratky OneLake. Ďalšie informácie nájdete v téme Dostupnosť Eventhouse OneLake.

Dôležité informácie pri výbere prístupu k načítavaniu údajov

Prípad použitia Odporúčanie
Nahrávanie malých súborov z lokálneho počítača Použitie lokálneho nahrávania súboru
Malé údaje alebo konkrétny konektor Používanie tokov údajov
Veľký zdroj údajov Používanie nástroja kopírovania v kanáloch
Zložité transformácie údajov Použitie kódu poznámkového bloku
Streamovacie údaje Použitie Eventstreamu na streamovanie údajov do služby Eventhouse; povoliť dostupnosť OneLake a vytvoriť odkaz z Lakehouse
Údaje časových radov Získanie údajov z lokality Eventhouse