Kurz o službe Lakehouse: Vytvorenie jazera, ingestu vzorových údajov a vytvorenie zostavy
V tomto kurze vytvoríte domov jazera, ingestujete vzorové údaje do tabuľky Delta, použijete transformáciu tam, kde je to potrebné, a potom vytvoríte zostavy. V tomto kurze sa naučíte:
- Vytvorenie jazera v službe Microsoft Fabric
- Stiahnutie a stiahnutie ukážky údajov o zákazníkoch
- Pridanie tabuliek do sémantického modelu
- Vytvorenie zostavy
Ak nemáte službu Microsoft Fabric, zaregistrujte si bezplatnú skúšobnú kapacitu.
Požiadavky
- Skôr než vytvoríte jazero, musíte vytvoriť pracovný priestor služby Fabric.
- Pred presunutím súboru CSV musíte mať nakonfigurovaný OneDrive. Ak ste OneDrive nenakonfigurovali, zaregistrujte si bezplatnú skúšobnú verziu služby Microsoft 365: bezplatnú skúšobnú verziu – vyskúšajte službu Microsoft 365 po dobu jedného mesiaca.
Vytvorenie jazera
V tejto časti vytvoríte lakehouse v službe Fabric.
V Fabricvyberte Pracovné priestory na navigačnom paneli.
Ak chcete otvoriť pracovný priestor, zadajte jeho názov do vyhľadávacieho poľa v hornej časti a vyberte ho z výsledkov vyhľadávania.
V pracovnom priestore vyberte
Nová položka a potom vyberteLakehouse . V dialógovom okne New lakehouse zadajte wwilakehousedo poľa Názov.
Ak chcete vytvoriť a otvoriť nový domov jazier, vyberte položku Vytvoriť .
Vzorové údaje ingestu
V tejto časti si prezeráte vzorové údaje zákazníkov do jazera.
Poznámka
Ak ste OneDrive nenakonfigurovali, zaregistrujte si bezplatnú skúšobnú verziu služby Microsoft 365: bezplatnú skúšobnú verziu – vyskúšajte službu Microsoft 365 po dobu jedného mesiaca.
Stiahnite si súbor dimension_customer.csv z odkladacieho priestoru vzoriek služby Fabric.
Na karte Domov v časti Získať údaje v službe Lakehouse sa zobrazia možnosti načítania údajov do jazera. Vyberte položku Nový tok údajov Gen2.
Na obrazovke nového toku údajov vyberte položku Importovať zo súboru Text/CSV.
Na obrazovke Pripojiť k zdrojuúdajov vyberte tlačidlo Nahrať súbor s prepínačom. Presuňte dimension_customer.csv súbor, ktorý ste stiahli v kroku 1. Po nahratí súboru vyberte položku Ďalej.
Na stránke Ukážka údajov súboru zobrazte ukážku údajov a pokračujte výberom položky Vytvoriť a vráťte sa späť na plátno toku údajov.
Na table Nastavenia dotazu aktualizujte pole Názov na dimension_customer.
Poznámka
Fabric predvolene pridá medzeru a číslo na koniec názvu tabuľky. Názvy tabuliek musia byť malé písmená a nesmú obsahovať medzery. Správne premenujte tabuľku a odstráňte z názvu tabuľky všetky medzery.
V tomto kurze ste svoje údaje o zákazníkoch pridružli k službe LakeHouse. Ak máte iné údajové položky, ktoré chcete priradiť k službe lakehouse, môžete ich pridať:
V položkách ponuky vyberte položku Pridať cieľové umiestnenie údajov a vyberte položku Lakehouse. Na obrazovke Pripojenie k cieľovej obrazovke údajov sa v prípade potreby prihláste do svojho konta a vyberte tlačidlo Ďalej.
Prejdite do wwilakehouse vo svojom pracovnom priestore.
Ak tabuľka dimension_customer neexistuje, vyberte nastavenie Nová tabuľka a zadajte názov tabuľky dimension_customer. Ak tabuľka už existuje, vyberte nastavenie Existujúca tabuľka a zo zoznamu tabuliek v prieskumníkovi objektov vyberte položku dimension_customer . Vyberte Ďalej.
Na table Vybrať cieľové nastavenia vyberte položku Nahradiť ako metódu Aktualizovať. Ak sa chcete vrátiť na plátno toku údajov, vyberte položku Uložiť nastavenia .
Na plátne toku údajov môžete jednoducho transformovať údaje na základe obchodných požiadaviek. Z dôvodu zjednodušenia sa v tomto kurze nijako nemení. Pokračujte tak, že v pravom dolnom rohu obrazovky vyberiete možnosť Publikovať .
Kruh točenia vedľa názvu toku údajov označuje, že publikovanie prebieha v zobrazení položky. Po dokončení publikovania vyberte položku ... a potom položku Vlastnosti. Premenujte tok údajov na Načítať tabuľku Lakehouse a vyberte položku Uložiť.
Vyberte možnosť Obnoviť vedľa názvu toku údajov a obnovte tok údajov. Táto možnosť spustí tok údajov a premiestni údaje zo zdrojového súboru do tabuľky lakehouse. Kým prebieha, v zobrazení položky sa v zobrazení položky zobrazí kruh točenia.
Po obnovení toku údajov vyberte na navigačnom paneli svoj nový domov lakehouse a zobrazte dimension_customer tabuľku Delta.
Výberom tabuľky zobrazíte ukážku údajov. Môžete tiež použiť koncový bod analýzy SQL lakehouse na dotazovanie údajov pomocou príkazov SQL. Vyberte koncového bodu SQL Analytics v rozbaľovacej ponuke Lakehouse v pravej hornej časti obrazovky.
Vyberte tabuľku dimension_customer na zobrazenie ukážky údajov alebo vyberte položku Nový dotaz SQL, čím napíšete príkazy SQL.
Nasledujúci ukážkový dotaz agreguje počet riadkov na základe stĺpca BuyingGroup (Nákupná skupina) tabuľky dimension_customer. Súbory dotazu SQL sa uložia automaticky pre budúce použitie a tieto súbory môžete podľa potreby premenovať alebo odstrániť.
Ak chcete spustiť skript, vyberte ikonu Spustiť v hornej časti súboru skriptu.
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
Vytvorenie zostavy
V tejto časti vytvoríte zostavu z vložených údajov.
V minulosti boli do sémantického modelu automaticky pridané všetky tabuľky a zobrazenia lakehouse. S najnovšími aktualizáciami je pre nové domovy lakehouse potrebné tabuľky manuálne pridať do sémantického modelu. Otvorte svoju zostavu lakehouse a prepnite sa na zobrazenie koncového bodu analýzy SQL. Na karte Vytváranie zostáv vyberte položku Spravovať predvolený sémantický model a vyberte tabuľky, ktoré chcete pridať do sémantického modelu. V tomto prípade vyberte tabuľku dimension_customer .
Ak chcete zabezpečiť, aby boli tabuľky v sémantickom modeli vždy synchronizované, prepnite na zobrazenie koncového bodu analýzy SQL a otvorte tablu nastavení lakehouse. Vyberte položku Predvolený sémantický model služby Power BI a zapnite možnosť Synchronizovať predvolený sémantický model služby Power BI. Ďalšie informácie nájdete v téme Predvolené sémantické modely služby Power BI.
Po pridaní tabuľky vytvorí Fabric sémantický model s rovnakým názvom ako lakehouse.
Na table sémantického modelu môžete zobraziť všetky tabuľky. Máte možnosti vytvoriť zostavy buď od začiatku, stránkované zostavy alebo nechať službu Power BI automaticky vytvoriť zostavu na základe vašich údajov. V tomto kurze v časti Preskúmať tieto údaje vyberte položku Automaticky vytvoriť zostavu. V ďalšom kurze vytvoríme zostavu úplne od začiatku.
Keďže tabuľka je dimenzia a neobsahuje v nej žiadne mierky, Power BI vytvorí mierku pre počet riadkov a agreguje ju do rôznych stĺpcov a vytvorí rôzne grafy, ako je to znázornené na nasledujúcom obrázku. Túto zostavu môžete uložiť na budúcnosť výberom položky Uložiť na hornom páse s nástrojmi. V tejto zostave môžete vykonať viac zmien, aby ste splnili svoje požiadavky, a to zahrnutím alebo vylúčením iných tabuliek alebo stĺpcov.