Čo sú schémy lakehouse (Preview)?
Lakehouse podporuje vytváranie vlastných schém. Schémy vám umožňujú zoskupiť tabuľky na zlepšenie zisťovania údajov, riadenia prístupu a ďalších možností.
Vytvorenie schémy jazera
Ak chcete povoliť podporu schémy pre váš lakehouse, začiarknite políčko vedľa schémy Lakehouse (Public Preview), keď ju vytvoríte.
Dôležité
Názvy pracovných priestorov musia obsahovať iba alfanumerické znaky z dôvodu obmedzení verzie Preview. Ak sa v názvoch pracovného priestoru používajú špeciálne znaky, niektoré funkcie lakehouse nebudú fungovať.
Po vytvorení lokality lakehouse môžete v časti Tabuľky nájsť predvolenú schému s názvom dbo. Táto schéma je tam vždy a nedá sa zmeniť ani odstrániť. Ak chcete vytvoriť novú schému, ukážte kurzorom na položku Tabuľky, vyberte položku ... a vyberte položku Nová schéma. Zadajte názov schémy a vyberte položku Vytvoriť. Vaša schéma sa zobrazí v abecednom poradí v časti Tabuľky .
Ukladať tabuľky v schéme lakehouse
Na uloženie tabuľky v schéme potrebujete názov schémy. V opačnom prípade prejde na predvolenú schému dbo .
df.write.mode("Overwrite").saveAsTable("contoso.sales")
Na usporiadanie tabuliek a presúvanie názvov tabuliek do rôznych schém môžete použiť prieskumník Lakehouse.
Výstraha
Ak upravíte tabuľku, musíte tiež aktualizovať súvisiace položky, ako je kód poznámkového bloku alebo toky údajov, aby sa zabezpečilo, že sú zarovnané so správnou schémou.
Prenos viacerých tabuliek pomocou odkazu na schému
Ak chcete odkazovať na viacero tabuliek Delta z iných úložísk služby Fabric lakehouse alebo externého úložiska, použite odkaz na schému, ktorá zobrazí všetky tabuľky vo vybratej schéme alebo priečinku. Všetky zmeny tabuliek v zdrojovom umiestnení sa zobrazia aj v schéme. Ak chcete vytvoriť odkaz na schému, ukážte na položku Tabuľky, vyberte položku ... a potom vyberte položku Nová skratka schémy. Potom vyberte schému na inom úložisku lakehouse alebo priečinok s tabuľkami Delta vo vašom externom úložisku, ako je napríklad Azure Data Lake Storage (ADLS) Gen2. Tým sa vytvorí nová schéma s vašimi odkazovanými tabuľkami.
Schémy access lakehouse pre vytváranie zostáv Power BI
Ak chcete vytvoriť sémantický model, stačí vybrať tabuľky, ktoré chcete použiť. Tabuľky môžu byť v rôznych schémach. Ak tabuľky z rôznych schém zdieľajú rovnaký názov, vedľa názvov tabuliek sa v zobrazení modelu zobrazia čísla.
Schémy lakehouse v notebooku
Keď sa pozriete na budovu lakehouse s povolenou schémou v prieskumníkovi objektov poznámkového bloku, vidíte, že tabuľky sú v schémach. Tabuľku môžete presunúť do bunky kódu a získať úryvok kódu, ktorý odkazuje na schému, v ktorej sa tabuľka nachádza. Tento priestor názvov použite, ak chcete odkazovať na tabuľky vo svojom kóde: workspace.lakehouse.schema.table. Ak niektoré z prvkov neodošlite, spustiteľný súbor použije predvolené nastavenie. Ak napríklad dáte len názov tabuľky, použije predvolenú schému (dbo) z predvoleného jazera na poznámkový blok.
Dôležité
Ak chcete v kóde použiť schémy, uistite sa, že predvolená lakehouse pre prenosný počítač je povolená schémou.
Dotazy Spark SQL krížového pracovného priestoru
Použite priestor názvov workspace.lakehouse.schema.table na odkazovanie na tabuľky vo vašom kóde. Týmto spôsobom môžete spájať tabuľky z rôznych pracovných priestorov, ak používateľ, ktorý spúšťa kód, má povolenie na prístup k tabuľkám.
SELECT *
FROM operations.hr.hrm.employees as employees
INNER JOIN global.corporate.company.departments as departments
ON employees.deptno = departments.deptno;
Dôležité
Uistite sa, že spájate tabuľky iba z domovov lakehouse, ktoré majú povolené schémy. Spájanie tabuliek z komplexov lakehouse, ktoré nemajú povolené schémy, nebude fungovať.
Obmedzenia verejnej ukážky
Nižšie sú uvedené nepodporované funkcie pre aktuálne vydanie verejnej ukážky. Vyriešia sa v nadchádzajúcich vydaniach pred všeobecnou dostupnosťou.
Nepodporované funkcie/ funkcie | Poznámky |
---|---|
Zdieľaný lakehouse | Použitie pracovného priestoru v priestore názvov pre zdieľané jazerá nebude fungovať, napríklad wokrkspace.sharedlakehouse.schema.table. Používateľ musí mať rolu pracovného priestoru, aby mohol používať pracovný priestor v priestore namaspace. |
Schéma ne delta, spravovanej tabuľky | Získanie schémy pre spravované tabuľky bez delta naformátované (napríklad CSV) nie je podporované. Po rozbalení týchto tabuliek v prieskumníkovi lakehouse sa vux nezobrazujú žiadne informácie o schéme. |
Tabuľky externej spark | Externé operácie tabuľky spark (napríklad zisťovanie, získanie schémy atď.) sa nepodporujú. Tieto tabuľky sú vo vstupných rozhraniach neidentifikovateľné. |
Verejné rozhranie API | Verejné rozhrania API (Zoznam tabuliek, Načítať tabuľku, vystavenie predvolenej vlastnosti Predĺžená vlastnosť schémy atď.) nie sú podporované pre schému enabled Lakehouse. Existujúce verejné rozhrania API s názvom zapnuté lakehouse so schémou majú za následok chybu. |
Aktualizácia vlastností tabuľky | Nepodporované. |
Názov pracovného priestoru obsahujúci špeciálne znaky | Pracovný priestor so špeciálnymi znakmi (napríklad medzerou, lomkami) nie je podporovaný. Zobrazí sa chyba používateľa. |
Zobrazenia Spark | Nepodporované. |
Špecifické funkcie hive | Nepodporované. |
Spark.catalog API | Nepodporované. Použite namiesto toho Spark SQL. |
USE <schemaName> |
Nefunguje v rámci krížových pracovných priestorov, ale je podporovaný v rámci toho istého pracovného priestoru. |
Migrácia | Migrácia existujúcich schém Lakehouses do domov lakehouse založených na schéme nie je podporovaná. |