Čo je zrkadlenie v fabric?
Zrkadlenie v službe Fabric je riešenie s nízkou cenou a nízkou latenciou, ktoré umožňuje spojiť údaje z rôznych systémov do jednej platformy na analýzu. Existujúce údajové priestory môžete neustále replikovať priamo do služby Fabric na OneLake z rôznych databáz Azure a externých zdrojov údajov.
S najaktuálnejšími údajmi v dotazovanom formáte v službe OneLake môžete teraz používať všetky rôzne služby v službe Fabric, ako je napríklad spúšťanie analýz so službou Spark, spúšťanie poznámkových blokov, dátové inžinierstvo, vizualizácia prostredníctvom zostáv Power BI a ďalšie.
Zrkadlenie v službe Fabric umožňuje používateľom využívať vysoko integrovaný komplexný a jednoducho použiteľný produkt, ktorý slúži na zjednodušenie vašich analytických potrieb. Zrkadlenie je určené na otvorenosť a spoluprácu medzi spoločnosťou Microsoft a technologickými riešeniami, ktoré dokážu prečítať opensourceový formát tabuľky Delta Lake. Zrkadlenie je riešenie s nízkym nákladom a nízkou latenciou na kľúč, ktoré vám umožňuje vytvoriť repliku údajov vo OneLake, ktoré možno použiť pre všetky vaše analytické potreby.
Tabuľky Delta sa potom môžu používať všade tam, kde je to možné, čo používateľom umožňuje urýchliť cestu do služby Fabric.
Prečo používať zrkadlenie v službe Fabric?
V súčasnosti majú mnohé organizácie kritické prevádzkové alebo analytické údaje sedia v silách.
Prístup k týmto údajom a práca s nimi si dnes vyžaduje komplexné kanály ETL (Extract Transform Load), obchodné procesy a rozhodovacie silá, ktoré vytvárajú:
- Obmedzený a obmedzený prístup k dôležitým údajom, neustále sa meniacich
- Trenie medzi ľuďmi, procesmi a technológiami
- Dlhé časy čakania na vytvorenie kanálov údajov a procesov pre kriticky dôležité údaje
- Nie je slobodu používať nástroje, ktoré potrebujete na analýzu a zdieľanie prehľadov pohodlne
- Nedostatok vhodných základov pre ľudí, aby sa zdieľali a spolupracovali na údajoch.
- Žiadne bežné, otvorené formáty údajov pre všetky analytické scenáre – BI, AI, integrácia, inžinierstvo a dokonca aj aplikácie
Zrkadlenie v službe Fabric poskytuje jednoduché prostredie na urýchlenie hodnoty času pre prehľady a rozhodnutia a rozdelenie údajových síl medzi technologickými riešeniami:
- Replikácia údajov a metaúdajov v takmer reálnom čase do dátového jazera SaaS so vstavanou analýzou pre BI a umelú inteligenciu
Platforma Microsoft Fabric je založená na softvéri ako službe SaaS, ktorý prenesie jednoduchosť a integráciu na úplne novú úroveň. Ďalšie informácie o službe Microsoft Fabric nájdete v téme Čo je Microsoft Fabric?
Zrkadlením sa v pracovnom priestore služby Fabric vytvoria tri položky:
- Zrkadlenie spravuje replikáciu údajov a metaúdajov do OneLake a konverziu na Parquet vo formáte pripravenom na analýzu. To umožňuje následné scenáre, ako sú dátové inžinierstvo, dátová veda a ďalšie.
- Koncový bod analýzy SQL
- Predvolený sémantický model
Okrem editora dotazov SQL existuje aj široký ekosystém nástrojov vrátane nástrojov SQL Server Management Studio (SSMS), rozšírenia mssql s Visual Studio Code a dokonca aj GitHubu Copilot.
Zdieľanie umožňuje jednoduchú kontrolu prístupu a správu, aby ste mali istotu, že môžete riadiť prístup k citlivým informáciám. Zdieľanie zároveň umožňuje bezpečné a demokratizované rozhodovanie v rámci celej organizácie.
Typy zrkadlenia
Fabric ponúka tri rôzne prístupy pri prenose údajov do OneLake prostredníctvom zrkadlenia.
- Zrkadlenie databázy – Zrkadlenie databázy v službe Microsoft Fabric umožňuje replikáciu celých databáz a tabuliek, čo umožňuje preniesť údaje z rôznych systémov do jednej analytickej platformy.
- Zrkadlenie metaúdajov – zrkadlenie metaúdajov v službe Fabric synchronizuje metaúdaje (napríklad názvy katalógov, schémy a tabuľky) namiesto fyzického premiestňovania údajov. Tento prístup využíva skratky, pričom zabezpečuje, aby údaje zostali v zdroji, zatiaľ čo sú stále ľahko dostupné v rámci služby Fabric.
- Otvorené zrkadlenie – otvorené zrkadlenie v službe Fabric je navrhnuté tak, aby rozšírilo zrkadlenie na základe otvoreného formátu tabuľky Delta Lake. Táto funkcia umožňuje každému vývojárovi napísať údaje o zmene aplikácie priamo do položky zrkadlovej databázy v službe Microsoft Fabric na základe prístupu otvoreného zrkadlenia a verejných rozhraní API.
V súčasnosti sú k dispozícii nasledujúce externé databázy:
Platforma | Replikácia v blízkosti v reálnom čase | Typ zrkadlenia | Podrobný kurz |
---|---|---|---|
Databázy služby Microsoft Fabric zrkadlové zo služby Azure Cosmos DB (Preview) | Áno | Zrkadlenie databázy | Kurz: Azure Cosmos DB |
Zrkadlové databázy služby Microsoft Fabric zo služby Azure Databricks (Preview) | Áno | Zrkadlenie metaúdajov | Kurz: Azure Databricks |
Zrkadlové databázy služby Microsoft Fabric z databázy Azure SQL | Áno | Zrkadlenie databázy | Kurz: Databáza Azure SQL |
Databázy služby Microsoft Fabric zrkadlové z Azure SQL Managed Instance (Preview) | Áno | Zrkadlenie databázy | Kurz: Azure SQL Managed Instance |
Zrkadlové databázy služby Microsoft Fabric zo služby Snowflake | Áno | Zrkadlenie databázy | Kurz: Snowflake |
Otvorené zrkadlové databázy (Preview) | Áno | Otvorené zrkadlenie | Kurz: Otvorené zrkadlenie |
Databázy služby Microsoft Fabric zrkadlové z databázy Fabric SQL (Preview) | Áno | Zrkadlenie databázy | Automaticky nakonfigurované |
Ako v reálnom čase replikácie zrkadlenie databázy práce?
Zrkadlenie je povolené vytvorením zabezpečeného pripojenia k vášmu prevádzkovému zdroju údajov. Môžete sa rozhodnúť, či chcete replikovať celú databázu alebo jednotlivé tabuľky, a zrkadlením sa údaje automaticky zachovajú v synchronizácii. Po nastavení sa údaje neustále replikujú do onelake na analytickú spotrebu.
Nižšie sú uvedené základné princípy zrkadlenia:
Povolenie zrkadlenia v službe Fabric je jednoduché a intuitívne bez nutnosti vytvárať zložité kanály ETL, priraďovať iné výpočtové zdroje a spravovať pohyb údajov.
Zrkadlenie v službe Fabric je plne spravovaná služba, takže sa nemusíte starať o hosťovanie, údržbu alebo správu replikácie zrkadlového pripojenia.
Ako funguje zrkadlenie metaúdajov?
Zrkadlenie umožňuje nielen replikáciu údajov, ale možno to dosiahnuť aj prostredníctvom odkazov alebo zrkadlenia metaúdajov namiesto úplného replikácie údajov, čo umožňuje, aby boli údaje k dispozícii bez ich fyzického pohybu alebo duplikovania. Zrkadlenie v tomto kontexte odkazuje iba na replikovanie metaúdajov, ako sú napríklad názvy katalógov, schém a tabuľky, a nie na samotné skutočné údaje. Tento prístup umožňuje službe Fabric sprístupniť údaje z rôznych zdrojov bez ich duplikácie, zjednodušenia správy údajov a minimalizovania potrieb úložiska.
Napríklad pri prístupe k údajom zaregistrovaným v Katalógu Unity služba Fabric zrkadlí iba štruktúru katalógu zo služby Azure Databricks, čo umožňuje prístup k základným údajom prostredníctvom skratiek. Táto metóda zabezpečí, že všetky zmeny v zdrojových údajoch sa okamžite prejavia v službe Fabric bez potreby premiestňovania údajov, zachovania synchronizácie v reálnom čase a zvýšenia efektivity pri prístupe k aktuálnym informáciám.
Ako funguje otvorené zrkadlenie?
Okrem toho, že zrkadlíte replikáciu údajov vytvorením zabezpečeného pripojenia k zdroju údajov, môžete tiež vybrať existujúceho poskytovateľa údajov alebo zapísať svoju vlastnú aplikáciu s cieľom dostať údaje do zrkadlovej databázy. Po vytvorení otvorenej zrkadlovej databázy prostredníctvom verejného rozhrania API alebo prostredníctvom portálu služby Fabric budete môcť získať URL adresu prvého kontaktu v službe OneLake, kde môžete pristáť na zmenu údajov podľa otvorených zrkadiel.
Keď sa údaje nachádzajú v zóne prvého kontaktu s náležitým formátom, replikácia sa spustí a bude spravovať zložitosť zlúčenia zmien s aktualizáciami, vložením a odstránením, ktoré sa majú premietnuť do delta tabuliek. Táto metóda zabezpečí, že všetky údaje napísané do prvého kontaktu budú okamžite a údaje v službe Fabric budú aktuálne.
Zdieľanie
Zdieľanie umožňuje jednoduchú kontrolu prístupu a správu, zatiaľ čo ovládacie prvky zabezpečenia, ako je napríklad zabezpečenie na úrovni riadkov (RLS) a zabezpečenie na úrovni objektu (OLS), a väčšia kontrola prístupu k citlivým informáciám. Zdieľanie zároveň umožňuje bezpečné a demokratizované rozhodovanie v rámci celej organizácie.
Zdieľaním používatelia udeľujú ostatným používateľom alebo skupine používateľov prístup k zrkadlovej databáze bez toho, aby mali prístup k pracovnému priestoru a ostatným položkám. Keď niekto zdieľa zrkadlovú databázu, udelí tiež prístup ku koncovému bodu analýzy SQL a priradenému predvolenému sémantickému modelu.
Ďalšie informácie nájdete v téme Zdieľanie zrkadlovej databázy a správa povolení.
Dotazy krížovej databázy
Vďaka údajom z zrkadlovej databázy uloženej vo OneLake môžete zapisovať dotazy krížovej databázy, spájať údaje zo zrkadlových databáz, skladov a koncových bodov analýzy SQL lakehouses v jednom dotaze T-SQL. Ďalšie informácie nájdete v téme Zápis dotazu krížovej databázy.
Môžete napríklad odkazovať na tabuľku zo zrkadlových databáz a skladov pomocou trojdielne pomenovávanie. V nasledujúcom príklade použite na odkazovanie ContosoSalesTable
trojdielne názvy v sklade ContosoWarehouse
. Z iných databáz alebo skladov je prvým krokom štandardnej trojdielnej konvencie pomenovania SQL názov zrkadlovej databázy.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Náklady na zrkadlenie
V prípade zrkadlenia databázy a otvoreného zrkadlenia je výpočet služby Fabric a úložisko OneLake až do limitu založeného na kapacite bezplatné.
- Ukladací priestor pre repliky je voľný až do limitu na základe veľkosti kapacity. Mirroring ponúka bezplatný terabajt zrkadlového úložiska pre každú kapacitu jednotky (CU), ktorú ste si zakúpili. Ak si napríklad kúpite kapacitu F64, získate 64 bezplatných terabajtov v hodnote úložiska, ktoré sa používa výlučne na zrkadlenie. V prípade prekročenia limitu bezplatného zrkadlového úložiska alebo po pozastavení kapacity sa úložisko OneLake účtuje. Ďalšie informácie nájdete cenách služby Microsoft Fabric.
- Výpočet služby Fabric použitý na replikovanie údajov do služby Fabric OneLake je bezplatný a nespotrebuje kapacitu. Požiadavky na OneLake ako súčasť zrkadlového procesu spotrebujú kapacitu ako normálnu spotrebu výpočtovej spotreby OneLake. Výpočet dotazovania údajov pomocou sql, Power BI alebo Spark sa účtuje za bežné ceny.
Dátový inžinier so zrkadlovými údajmi databázy
Microsoft Fabric poskytuje rôzne možnosti dátového inžinierstva, aby ste zaistili, že údaje budú ľahko dostupné, dobre usporiadané a vysokokvalitné. Z Dátový inžinier Fabric môžete:
- Vytvorenie a správa údajov ako služby Spark pomocou služby Lakehouse
- Navrhujte kanály na kopírovanie údajov do vášho jazera
- Použitie definícií úloh spark na odoslanie úlohy dávkového/streamu do klastra Spark
- Poznámkové bloky môžete použiť na písanie kódu na príjem, prípravu a transformáciu údajov
Dátová veda so zrkadlovými údajmi databázy
Microsoft Fabric ponúka službe Fabric Data Science umožniť používateľom dokončiť komplexné pracovné postupy v oblasti dátovej vedy na účely obohatenia údajov a podnikových prehľadov. Môžete dokončiť širokú škálu aktivít v rámci celého procesu dátovej vedy, od skúmania, prípravy a čistenia údajov až po experimentovanie, modelovanie, bodovanie modelov a zobrazovanie prediktívnych prehľadov do zostáv BI.
Používatelia služby Microsoft Fabric majú prístup k vyťaženiu dátovej vedy. Odtiaľ môžu zisťovať rôzne relevantné zdroje a pristupovať k nim. Môžu napríklad vytvárať experimenty strojového učenia, modely a poznámkové bloky. Môžu tiež importovať existujúce poznámkové bloky na domovskej stránke Dátovej vedy.
Databáza SQL v službe Fabric
Priamo môžete vytvoriť a spravovať databázu SQL v službe Microsoft Fabric (Preview) na portáli služby Fabric. Na základe databázy Azure SQL sa databáza SQL v službe Fabric automaticky odráža na analytické účely a umožňuje jednoducho vytvoriť prevádzkovú databázu v službe Fabric. Databáza SQL je domovom v službe Fabric pre vyťaženia OLTP a dokáže sa integrovať s integráciou správy zdrojového kódu služby Fabric.