Denníky Delta Lake v sklade v službe Microsoft Fabric
Vzťahuje sa na:✅ Warehouse v službe Microsoft Fabric
Warehouse v službe Microsoft Fabric obsahuje formáty otvorených súborov. Tabuľky používateľov sú uložené vo formáte súboru parquet a denníky Delta Lake sú publikované pre všetky tabuľky používateľov.
Denníky Delta Lake otvára priamy prístup k používateľským tabuľkám skladu pre každý nástroj, ktorý dokáže čítať tabuľky Delta Lake. Tento prístup je obmedzený na iba na čítanie, aby sa zabezpečilo, že údaje o používateľovi dodržiavajú súlad transakcií ACID. Všetky vloženia, aktualizácie a odstránenia do údajov v tabuľkách musia byť vykonané prostredníctvom skladu. Po spáchaní transakcie sa spustí proces na pozadí systému na publikovanie aktualizovaného denníka Delta Lake pre dotknuté tabuľky.
Ako získať cestu OneLake
Nasledujúce kroky podrobne popisujú spôsob získania cesty OneLake z tabuľky v sklade:
Otvorte položku Warehouse vo svojom pracovnom priestore služby Microsoft Fabric.
V Prieskumníkovi objektov nájdete ďalšie možnosti (...) vo vybratej tabuľke v priečinku Tabuľky. Vyberte ponuku Vlastnosti .
Pri výbere sa na table Vlastnosti zobrazia tieto informácie:
- Meno
- Formát
- Typ
- URL
- Relatívna cesta
- Cesta k ABFS
Ako získať cestu k denníkom Delta Lake
Denníky delta lake môžete vyhľadať pomocou nasledujúcich metód:
Denníky Delta Lake možno dotazovať prostredníctvom skratiek vytvorených v objekte lakehouse. Súbory môžete zobraziť pomocou poznámkového bloku Služby Microsoft Fabric Spark alebo prieskumníka Lakehouse v službe Fabric Dátový inžinier na portáli služby Microsoft Fabric.
Denníky Delta Lake možno nájsť prostredníctvom prieskumníka Azure Storage Explorer prostredníctvom pripojení Spark, ako je napríklad režim Power BI Direct Lake, alebo pomocou akejkoľvek inej služby, ktorá dokáže čítať delta tabuľky.
Denníky Delta Lake sa nachádzajú v priečinku
_delta_log
každej tabuľky prostredníctvom OneLake Explorer vo Windowse, ako je znázornené na nasledujúcej snímke obrazovky.
Pozastavenie publikovania denníka v delta lake
Publikovanie denníkov Delta Lake sa môže pozastaviť a v prípade potreby obnoviť. Pri pozastavení publikovania sa motorom služby Microsoft Fabric, ktoré čítajú tabuľky mimo skladu, zobrazia údaje tak, ako boli pred pozastavením. Zabezpečí, že zostavy zostanú stabilné a konzistentné a budú odrážať údaje zo všetkých tabuliek tak, ako existovali pred vykonaním zmien v tabuľkách. Po dokončení aktualizácií údajov môžete obnoviť publikovanie denníka Delta Lake, aby boli všetky najnovšie zmeny údajov viditeľné pre iné analytické nástroje. Ďalším prípadom použitia na pozastavenie publikovania denníka delta Lake je vtedy, keď používatelia nepotrebujú interoperabilitu s inými výpočtovými motormi v službe Microsoft Fabric, pretože môže pomôcť ušetriť na výpočtových nákladoch.
Syntax na pozastavenie a obnovenie publikovania denníka Delta Lake je nasledovná:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED | AUTO
Príklad: Pozastavenie a obnovenie publikovania denníka Delta Lake
Ak chcete pozastaviť publikovanie denníka Delta Lake, použite nasledujúci úryvok kódu:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED
Dotazy na skladové tabuľky v aktuálnom sklade z iných strojov služby Microsoft Fabric (napríklad dotazy z Lakehouse) teraz zobrazujú verziu údajov tak, ako bola pred pozastavením publikovania denníka služby Delta Lake. Skladové dotazy stále zobrazujú najnovšiu verziu údajov.
Ak chcete pokračovať v publikovaní denníka Delta Lake, použite nasledujúci úryvok kódu:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = AUTO
Po zmene stavu späť na funkciu AUTO nástroj skladu služby Fabric publikuje denníky všetkých posledných zmien vykonaných v tabuľkách v sklade, čím ostatným analytickým motorom v službe Microsoft Fabric umožní čítať najnovšiu verziu údajov.
Kontrola stavu publikovania denníka Delta Lake
Ak chcete skontrolovať aktuálny stav publikovania denníka Delta Lake vo všetkých skladoch aktuálneho pracovného priestoru, použite nasledujúci úryvok kódu:
SELECT [name], [DATA_LAKE_LOG_PUBLISHING_DESC] FROM sys.databases
Obmedzenia
- Názvy tabuliek môže používať služba Spark a iné systémy iba vtedy, ak obsahujú iba tieto znaky: A – Z a – z 0 – 9 a znaky podčiarknutia.
- Názvy stĺpcov, ktoré použije Spark a iné systémy, nemôžu obsahovať:
- Priestory
- karty
- znaky konca riadka
- [
- ,
- ;
- {
- }
- (
- )
- =
- ]