Zrkadlenie služby Azure Cosmos DB (Preview)
Mirroring v službe Microsoft Fabric poskytuje bezproblémovú skúsenosť bez ETL na integráciu existujúcich údajov služby Azure Cosmos DB so zvyškom údajov v službe Microsoft Fabric. Vaše údaje Azure Cosmos DB sa nepretržite replikujú priamo do služby Fabric OneLake v takmer reálnom čase bez akéhokoľvek vplyvu na výkon vašich transakčných služieb alebo spotrebúvaných jednotiek požiadaviek (RU).
Údaje v službe OneLake sa ukladajú v open-source formáte delta a automaticky sa sprístupnia všetkým analytickým motorom na fabrice.
Na prístup k údajom v službe OneLake v režime DirectLake môžete využiť vstavané funkcie služby Power BI. Vďaka Copilot vylepšeniam v službe Fabric môžete využiť silu generativnej umelej inteligencie na získanie kľúčových prehľadov o obchodných údajoch. Okrem služby Power BI môžete pomocou T-SQL spúšťať komplexné agregované dotazy alebo použiť službu Spark na prieskum údajov. Môžete bez problémov pristupovať k údajom v poznámkových blokoch a pomocou dátovej vedy vytvárať modely strojového učenia.
Dôležité
Zrkadlenie služby Azure Cosmos DB je momentálne vo verzii Preview. Produkčné vyťaženia sa počas verzie Preview nepodporujú. V súčasnosti je podporovaná len služba Azure Cosmos DB pre kontá NoSQL.
Prečo používať zrkadlenie v službe Fabric?
So zrkadlením v službe Fabric nemusíte spojiť rôzne služby od viacerých dodávateľov. Namiesto toho si môžete vychutnať vysoko integrovaný komplexný a jednoducho použiteľný produkt, ktorý slúži na zjednodušenie vašich analytických potrieb a vytvorenie pre otvorenosť.
Ak hľadáte vytváranie zostáv alebo analýzu z prevádzkových údajov v službe Azure Cosmos DB, zrkadlenie poskytuje:
- No-ETL, nákladovo efektívny prístup takmer v reálnom čase k vašim údajom Azure Cosmos DB bez toho, aby sa pôsobením spotreby vašej jednotky požiadavky
- Jednoduché prinášanie údajov z rôznych zdrojov do služby Fabric OneLake
- Optimalizácia tabuľky Delta pomocou poradia pre bleskové rýchle čítanie
- Integrácia jedným kliknutím so službou Power BI s aplikáciou Direct Lake a Copilot
- Bohaté podnikové prehľady spojením údajov z rôznych zdrojov
- Bohatšia integrácia aplikácií na prístup k dotazom a zobrazeniam
Údaje oneLake sú uložené v open-source formáte Delta Lake, čo vám umožňuje ich používať s rôznymi riešeniami v rámci spoločnosti Microsoft aj mimo nej. Tento formát údajov pomáha zjednodušiť vytváranie jednej údajovej nehnuteľnosti pre vaše analytické potreby.
Aké možnosti analýzy sú vstavané?
Zrkadlové databázy sú položkou v sklade údajov služby Fabric, ktorá sa odlišuje od koncového bodu analýzy Warehouse a SQL.
Každá zrkadlová databáza Azure Cosmos DB má tri položky, s ktorými môžete pracovať v pracovnom priestore služby Fabric:
- Položka zrkadlovej databázy. Zrkadlenie spravuje replikáciu údajov do OneLake a konverziu na Parquet vo formáte pripravenom na analýzu. To umožňuje následné scenáre, ako sú dátové inžinierstvo, dátová veda a ďalšie.
- Koncový bod analýzy SQL, ktorý sa automaticky vygeneruje
- Predvolený sémantický model, ktorý sa automaticky vygeneruje
Zrkadlová databáza
Zrkadlová databáza zobrazuje stav replikácie a ovládacie prvky na zastavenie alebo spustenie replikácie v fabric OneLake. Zdrojovú databázu môžete zobraziť aj v režime iba na čítanie pomocou prieskumníka údajov Azure Cosmos DB. Pomocou Prieskumníka údajov môžete zobraziť kontajnery vo svojej zdrojovej databáze Azure Cosmos DB a dotazovať ich. Tieto operácie spotrebúvajú jednotky požiadaviek (RU) z vášho konta Azure Cosmos DB. Všetky zmeny zdrojovej databázy sa okamžite prejavia v zobrazení zdrojovej databázy služby Fabric. Zapisovanie do zdrojovej databázy nie je povolené zo služby Fabric, pretože môžete len zobrazovať údaje.
Koncový bod analýzy SQL
Každá zrkadlová databáza má automaticky generovaný koncový bod analýzy SQL, ktorý poskytuje bohaté analytické skúsenosti na základe tabuliek Delta OneLake vytvorených zrkadlovým procesom. Máte prístup k známym príkazom T-SQL, ktoré dokážu definovať a dotazovať objekty údajov, ale nemanipulovať s údajmi z koncového bodu analýzy SQL, pretože ide o kópiu iba na čítanie.
V koncovom bode analýzy SQL môžete vykonávať nasledujúce akcie:
- Preskúmajte tabuľky Delta Lake pomocou T-SQL. Každá tabuľka je priradená ku kontajneru z databázy Azure Cosmos DB.
- Vytvorte dotazy a zobrazenia bez použitia kódu a preskúmajte ich vizuálne bez toho, aby ste museli napísať riadok kódu.
- Pripojte sa a dotazujte údaje v iných zrkadlových databázach, skladoch a službe Lakehouses v tom istom pracovnom priestore.
- Zostavy BI môžete jednoducho vizualizovať a vytvárať na základe dotazov alebo zobrazení SQL.
Okrem editora dotazov SQL existuje aj široký ekosystém nástrojov. Tieto nástroje zahŕňajú rozšírenie mssql s Visual Studio Code, SQL Server Management Studio (SSMS) a dokonca aj GitHub Copilot. Z nástroja, ktorý ste si vybrali, môžete dobiť analýzu a prehľady.
Sémantický model
Predvoleným sémantickým modelom je automaticky zriadiť sémantický model služby Power BI. Táto funkcia umožňuje vytvárať, zdieľať a opätovne používať podnikové metriky. Ďalšie informácie nájdete v téme sémantické modely.
Ako v blízkosti real-time replikácie práce?
Ak povolíte zrkadlenie databázy Azure Cosmos DB, vložte, aktualizujte a odstránite operácie spracovania online transakcií (OLTP), údaje sa nepretržite replikujú do služby Fabric OneLake na analytickú spotrebu.
Funkcia priebežného zálohovania je nevyhnutným predpokladom zrkadlenia. V konte služby Azure Cosmos DB môžete povoliť 7-dňovú alebo 30-dňovú nepretržitú zálohu. Ak ste zapnutá nepretržitú zálohu špeciálne pre zrkadlenie, odporúča sa 7-dňové priebežné zálohovanie, pretože je zadarmo.
Poznámka
Zrkadlenie nepoužíva analytický ukladací priestor služby Azure Cosmos DB ani zmenu informačného kanála ako zdroj zberu údajov. Tieto funkcie môžete aj naďalej používať nezávisle od seba, spolu so zrkadlením.
Replikovanie údajov služby Azure Cosmos DB do služby Fabric OneLake môže trvať niekoľko minút. V závislosti od počiatočnej snímky údajov alebo frekvencie aktualizácií alebo odstránení môže v niektorých prípadoch trvať aj dlhšie replikácia. Replikácia nemá vplyv na jednotky požiadaviek (RU), ktoré ste pridelili pre vyťaženia transakcií.
Čo môžete očakávať od zrkadlenia
Existuje niekoľko dôležitých informácií a podporovaných scenárov, ktoré by ste mali zvážiť pred zrkadlením.
Dôležité informácie týkajúce sa nastavenia
Ak chcete zrkadliť databázu, už by mala byť zriadená v Azure. Na konte je potrebné povoliť priebežné zálohovanie.
- Každú databázu môžete zrkadliť iba jednotlivo. Databázu si môžete vybrať, ktorá sa má zrkadliť.
- Rovnakú databázu môžete zrkadliť v rámci toho istého pracovného priestoru viackrát. Najlepšie je, že jednu kópiu databázy je možné opakovane použiť naprieč jazerami, skladmi alebo inými zrkadlovými databázami. Do rovnakej databázy by ste nemali nastavovať viaceré zrkadlá.
- Rovnakú databázu môžete zrkadliť aj v rôznych pracovných priestoroch alebo nájomníkoch služby Fabric.
- Zmeny kontajnerov Azure Cosmos DB, ako je napríklad pridanie nových kontajnerov a odstránenie existujúcich kontajnerov, sa bezproblémovo replikujú do služby Fabric. Prázdnu databázu môžete začať zrkadliť napríklad bez kontajnerov a zrkadlením sa kontajnery pridané neskôr bezproblémovo zodvihne.
Podpora vnorených údajov
Vnorené údaje sa zobrazujú ako reťazec JSON v tabuľkách koncového bodu analýzy SQL. Pomocou dotazov alebo OPENJSON
zobrazení T-SQL môžete CROSS APPLY
OUTER APPLY
tieto údaje selektívne rozbaliť. Ak používate doplnok Power Query, môžete použiť funkciu ToJson
na rozbalenie týchto údajov.
Poznámka
Fabric má obmedzenie pre stĺpce reťazcov s veľkosťou 8 kB. Ďalšie informácie nájdete v téme Obmedzenia skladu údajov.
Spracovanie zmien schémy
Zrkadlením sa automaticky replikujú vlastnosti v rámci položiek služby Azure Cosmos DB so zmenami schémy. Všetky nové vlastnosti objavené v položke sa zobrazujú ako nové stĺpce a chýbajúce vlastnosti, ak existujú, sú v službe Fabric zastúpené ako null.
Ak premenujete vlastnosť v položke, tabuľky služby Fabric si zachovajú starý aj nový stĺpce. Starý stĺpec zobrazí hodnotu null a nový zobrazí najnovšiu hodnotu pre všetky položky, ktoré sa replikujú po operácii premenovania.
Ak zmeníte typ údajov vlastnosti v položkách Azure Cosmos DB, zmeny sa podporujú pre kompatibilné typy údajov, ktoré možno skonvertovať. Ak typy údajov nie sú kompatibilné na konverziu v delte, sú zastúpené ako hodnoty null.
Tabuľky koncového bodu analýzy SQL konvertujú typy údajov Delta na typy údajov T-SQL.
Duplicitné názvy stĺpcov
Služba Azure Cosmos DB podporuje názvy stĺpcov bez rozlišovania veľkých a malých písmen na základe štandardu JSON. Zrkadlenie podporuje tieto duplicitné názvy stĺpcov tým, _n
že do názvu stĺpca pridáte n
číselnú hodnotu.
Ak má addressName
napríklad položka Azure Cosmos DB a AddressName
ako jedinečné vlastnosti, tabuľky služby Fabric majú zodpovedajúce addressName
stĺpce a AddressName_1
stĺpce. Ďalšie informácie nájdete v téme Obmedzenia replikácie.
Zabezpečenie
Pripojenia k zdrojovej databáze sú založené na kľúčoch kont pre vaše kontá Azure Cosmos DB. Ak otočíte alebo opätovne vygenerujete kľúče, musíte aktualizovať pripojenia, aby sa zaistilo, že replikácia funguje. Ďalšie informácie nájdete v téme Pripojenia.
Kľúče kont sa po nastavení pripojenia priamo nezobrazujú ostatným používateľom služby Fabric. Môžete obmedziť, kto má prístup k pripojeniam vytvoreným v službe Fabric. Zápisy nie sú povolené pre databázu Azure Cosmos DB z koncového bodu prieskumníka údajov ani koncového bodu analýzy v zrkadlovej databáze.
Zrkadlenie v súčasnosti nepodporuje overovanie pomocou kľúčov konta iba na čítanie, jediného prihlásenia (SSO) pomocou ID spoločnosti Microsoft, riadenia prístupu na základe rolí alebo spravovaných identít.
Po replikácii údajov do služby Fabric OneLake je potrebné zabezpečiť prístup k týmto údajom.
Funkcie ochrany údajov
Podrobné zabezpečenie je možné nakonfigurovať v zrkadlovej databáze služby Microsoft Fabric. Ďalšie informácie nájdete v téme Podrobné povolenia v službe Microsoft Fabric.
Filtre stĺpcov a filtre riadkov založené na predikte môžete zabezpečiť pre tabuľky pre roly a používateľov v službe Microsoft Fabric:
- Zabezpečenie na úrovni riadkov v sklade údajov služby Fabric
- Zabezpečenie na úrovni stĺpcov v sklade údajov v službe Fabric
Pomocou dynamického maskovania údajov môžete tiež maskovať citlivé údaje používateľov, ktorí nie sú správcami:
Sieťové zabezpečenie
Zrkadlenie v súčasnosti nepodporuje súkromné koncové body alebo kľúče spravované zákazníkom (CMK) v službe OneLake. Zrkadlenie nie je podporované pre kontá Azure Cosmos DB s konfiguráciami zabezpečenia siete menej obmedzujúce ako všetky siete, používanie koncových bodov služby, používanie súkromných koncových bodov, používanie IP adries alebo používanie iných nastavení, ktoré by mohli obmedziť prístup verejnej siete k kontu. Kontá Azure Cosmos DB by mali byť otvorené pre všetky siete, s ktorými môžu pracovať.
Zotavenie po havárii a latencia replikácie
V službe Fabric môžete nasadiť obsah do dátových centier v iných oblastiach než v domovskej oblasti nájomníka služby Fabric. Ďalšie informácie nájdete v téme Podpora viacerých geografických oblastí.
Pre konto Azure Cosmos DB s primárnou oblasťou zápisu a viacerými oblasťami čítania sa zrkadlením vyberie oblasť čítania Azure Cosmos DB najbližšie k oblasti, v ktorej je nakonfigurovaná kapacita služby Fabric. Tento výber pomáha poskytnúť replikáciu s nízkou latenciou pre zrkadlenie.
Keď prepnete svoje konto Azure Cosmos DB do oblasti obnovenia, zrkadlením sa automaticky znova vyberie najbližšia oblasť Služby Azure Cosmos DB.
Poznámka
Zrkadlenie nepodporuje kontá s viacerými oblasťami zápisu.
Replikovanie údajov služby Cosmos DB do služby OneLake musí byť nakonfigurované na spracovanie výpadkov v celej oblasti. Ďalšie informácie nájdete v téme Zotavenie po havárii v OneLake.
Skúmanie údajov zrkadlením
V službe OneLake môžete priamo zobraziť zrkadlové údaje a získať k nim prístup. Bez ďalšieho pohybu údajov môžete tiež bez problémov pristupovať k zrkadleným údajom.
Získajte ďalšie informácie o prístupe k OneLake pomocou rozhraní ADLS Gen2 API alebo SDK, prieskumníka súborov OneLake a prieskumníka Azure Storage.
Ku koncovému bodu SQL Analytics sa môžete pripojiť z nástrojov, ako je napríklad SQL Server Management Studio (SSMS) alebo pomocou ovládačov, ako je pripojenie k databáze Microsoft Open Database Connectivity (ODBC) a pripojenie k databáze Java (JDBC). Ďalšie informácie nájdete v téme Pripojiteľnosť koncového bodu analýzy SQL.
So službami môžete získať prístup aj k zrkadlovým údajom, ako napríklad:
- Služby Azure, ako sú Azure Databricks, Azure HDInsight alebo Azure Synapse Analytics
- Fabric Lakehouse používa skratky pre scenáre dátového inžinierstva a dátovej vedy
- Iné zrkadlové databázy alebo sklady v pracovnom priestore služby Fabric
Môžete tiež vytvoriť riešenia architektúry medailónov, pričom ako bronzovú vrstvu transformujete údaje, ktoré pristávajú, do zrkadlovej databázy. Ďalšie informácie nájdete v téme Podpora architektúry medailí v službe Fabric.
Ceny
Výpočet služby Fabric použitý na replikovanie údajov cosmos DB do služby Fabric OneLake je bezplatný. Úložisko v službe OneLake je bezplatné a založené na veľkosti kapacity. Ďalšie informácie nájdete v téme Ceny služby OneLake za zrkadlenie. Výpočtové použitie na dotazovanie údajov prostredníctvom sql, Power BI alebo Spark sa stále účtuje na základe kapacity služby Fabric.
Ak používate prieskumníka údajov v zrkadlení služby Fabric, môžete kumulovať typické náklady na základe používania jednotky požiadavky (RU), aby ste mohli preskúmať kontajnery a dotazovať položky v zdrojovej databáze Azure Cosmos DB. Funkcia nepretržitého zálohovania služby Azure Cosmos DB je nevyhnutným predpokladom zrkadlenia: Platia štandardné poplatky za nepretržitú zálohu. Nie sú žiadne ďalšie poplatky za zrkadlenie na priebežnú záložnú fakturáciu. Ďalšie informácie nájdete v téme Ceny služby Azure Cosmos DB.