Zdieľať cez


Čo sú schémy lakehouse (Preview)?

Lakehouse podporuje vytváranie vlastných schém. Schémy vám umožňujú zoskupiť tabuľky na zlepšenie zisťovania údajov, riadenia prístupu a ďalších možností.

Vytvorenie schémy jazera

Ak chcete povoliť podporu schémy pre váš lakehouse, začiarknite políčko vedľa schémy Lakehouse (Public Preview), keď ju vytvoríte.

Snímka obrazovky zobrazujúca dialógové okno nového jazera.

Dôležité

Názvy pracovných priestorov musia obsahovať iba alfanumerické znaky z dôvodu obmedzení verzie Preview. Ak sa v názvoch pracovného priestoru používajú špeciálne znaky, niektoré funkcie lakehouse nebudú fungovať.

Po vytvorení lokality lakehouse môžete v časti Tabuľky nájsť predvolenú schému s názvom dbo. Táto schéma je tam vždy a nedá sa zmeniť ani odstrániť. Ak chcete vytvoriť novú schému, ukážte kurzorom na položku Tabuľky, vyberte položku ... a vyberte položku Nová schéma. Zadajte názov schémy a vyberte položku Vytvoriť. Vaša schéma sa zobrazí v abecednom poradí v časti Tabuľky .

Snímka obrazovky zobrazujúca dialógové okno s novou schémou lakehouse.

Ukladať tabuľky v schéme lakehouse

Na uloženie tabuľky v schéme potrebujete názov schémy. V opačnom prípade prejde na predvolenú schému dbo .

df.write.mode("Overwrite").saveAsTable("contoso.sales")

Na usporiadanie tabuliek a presúvanie názvov tabuliek do rôznych schém môžete použiť prieskumník Lakehouse.

Animácia presúvania tabuliek medzi schémami.

Výstraha

Ak upravíte tabuľku, musíte tiež aktualizovať súvisiace položky, ako je kód poznámkového bloku alebo toky údajov, aby sa zabezpečilo, že sú zarovnané so správnou schémou.

Prenos viacerých tabuliek pomocou odkazu na schému

Ak chcete odkazovať na viacero tabuliek Delta z iných úložísk služby Fabric lakehouse alebo externého úložiska, použite odkaz na schému, ktorá zobrazí všetky tabuľky vo vybratej schéme alebo priečinku. Všetky zmeny tabuliek v zdrojovom umiestnení sa zobrazia aj v schéme. Ak chcete vytvoriť odkaz na schému, ukážte na položku Tabuľky, vyberte položku ... a potom vyberte položku Nová skratka schémy. Potom vyberte schému na inom úložisku lakehouse alebo priečinok s tabuľkami Delta vo vašom externom úložisku, ako je napríklad Azure Data Lake Storage (ADLS) Gen2. Tým sa vytvorí nová schéma s vašimi odkazovanými tabuľkami.

Snímka obrazovky zobrazujúca novú skratku schémy lakehouse.

Schémy access lakehouse pre vytváranie zostáv Power BI

Ak chcete vytvoriť sémantický model, stačí vybrať tabuľky, ktoré chcete použiť. Tabuľky môžu byť v rôznych schémach. Ak tabuľky z rôznych schém zdieľajú rovnaký názov, vedľa názvov tabuliek sa v zobrazení modelu zobrazia čísla.

Schémy lakehouse v notebooku

Keď sa pozriete na budovu lakehouse s povolenou schémou v prieskumníkovi objektov poznámkového bloku, vidíte, že tabuľky sú v schémach. Tabuľku môžete presunúť do bunky kódu a získať úryvok kódu, ktorý odkazuje na schému, v ktorej sa tabuľka nachádza. Tento priestor názvov použite, ak chcete odkazovať na tabuľky vo svojom kóde: workspace.lakehouse.schema.table. Ak niektoré z prvkov neodošlite, spustiteľný súbor použije predvolené nastavenie. Ak napríklad dáte len názov tabuľky, použije predvolenú schému (dbo) z predvoleného jazera na poznámkový blok.

Dôležité

Ak chcete v kóde použiť schémy, uistite sa, že predvolená lakehouse pre prenosný počítač je povolená schémou.

Dotazy Spark SQL krížového pracovného priestoru

Použite priestor názvov workspace.lakehouse.schema.table na odkazovanie na tabuľky vo vašom kóde. Týmto spôsobom môžete spájať tabuľky z rôznych pracovných priestorov, ak používateľ, ktorý spúšťa kód, má povolenie na prístup k tabuľkám.

SELECT * 
    FROM operations.hr.hrm.employees as employees 
    INNER JOIN global.corporate.company.departments as departments
    ON employees.deptno = departments.deptno;

Dôležité

Uistite sa, že spájate tabuľky iba z domovov lakehouse, ktoré majú povolené schémy. Spájanie tabuliek z komplexov lakehouse, ktoré nemajú povolené schémy, nebude fungovať.

Obmedzenia verejnej ukážky

Nižšie sú uvedené nepodporované funkcie pre aktuálne vydanie verejnej ukážky. Vyriešia sa v nadchádzajúcich vydaniach pred všeobecnou dostupnosťou.

Nepodporované funkcie/ funkcie Poznámky
Zdieľaný lakehouse Použitie pracovného priestoru v priestore názvov pre zdieľané jazerá nebude fungovať, napríklad wokrkspace.sharedlakehouse.schema.table. Používateľ musí mať rolu pracovného priestoru, aby mohol používať pracovný priestor v priestore namaspace.
Schéma ne delta, spravovanej tabuľky Získanie schémy pre spravované tabuľky bez delta naformátované (napríklad CSV) nie je podporované. Po rozbalení týchto tabuliek v prieskumníkovi lakehouse sa vux nezobrazujú žiadne informácie o schéme.
Tabuľky externej spark Externé operácie tabuľky spark (napríklad zisťovanie, získanie schémy atď.) sa nepodporujú. Tieto tabuľky sú vo vstupných rozhraniach neidentifikovateľné.
Verejné rozhranie API Verejné rozhrania API (Zoznam tabuliek, Načítať tabuľku, vystavenie predvolenej vlastnosti Predĺžená vlastnosť schémy atď.) nie sú podporované pre schému enabled Lakehouse. Existujúce verejné rozhrania API s názvom zapnuté lakehouse so schémou majú za následok chybu.
Aktualizácia vlastností tabuľky Nepodporované.
Názov pracovného priestoru obsahujúci špeciálne znaky Pracovný priestor so špeciálnymi znakmi (napríklad medzerou, lomkami) nie je podporovaný. Zobrazí sa chyba používateľa.
Zobrazenia Spark Nepodporované.
Špecifické funkcie hive Nepodporované.
Spark.catalog API Nepodporované. Použite namiesto toho Spark SQL.
USE <schemaName> Nefunguje v rámci krížových pracovných priestorov, ale je podporovaný v rámci toho istého pracovného priestoru.
Migrácia Migrácia existujúcich schém Lakehouses do domov lakehouse založených na schéme nie je podporovaná.