Spiegeln von Snowflake in Microsoft Fabric
Die Spiegelung in Fabric bietet eine einfache Benutzererfahrung, um komplexe ETL-Prozesse (Extraktion, Transformation, Laden) zu vermeiden und Ihr vorhandenes Snowflake-Datenlager mit Ihren übrigen Daten in Microsoft Fabric zu integrieren. Sie können Ihre bestehenden Snowflake-Daten kontinuierlich direkt in OneLake von Fabric replizieren. Innerhalb von Fabric können Sie leistungsstarke Business Intelligence, künstliche Intelligenz, Datentechnik, Data Science- und Datenfreigabeszenarien nutzen.
Ein Tutorial zum Konfigurieren Ihrer Snowflake-Datenbank für die Spiegelung in Fabric finden Sie im Tutorial: Konfigurieren von in Microsoft Fabric gespiegelten Datenbanken aus Snowflake.
Gründe für die Nutzung der Spiegel-Funktion in Fabric.
Mit der Spiegelung in Fabric vermeiden Sie, verschiedene Dienste von mehreren Anbietern kombinieren zu müssen. Stattdessen profitieren Sie von einem hochgradig integrierten, benutzerfreundlichen End-to-End-Produkt, das Ihre Analyseanforderungen vereinfacht und auf Offenheit und Zusammenarbeit zwischen Microsoft, Snowflake und zahllosen Technologielösungen ausgelegt ist, die das Open-Source-Tabellenformat von Delta Lake lesen können.
Welche Analyseerfahrungen sind integriert?
Gespiegelte Datenbanken sind ein Element in Fabric Data Warehousing, das sich von Warehouse- und SQL-Analyseendpunkten unterscheidet.
Die Spiegelung erstellt drei Elemente in Ihrem Fabric-Arbeitsbereich:
- Das gespiegelte Datenbankelement. Die Spiegelung verwaltet die Replikation von Daten in OneLake und die Konvertierung in Parquet in einem analysierbaren Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr.
- Ein SQL-Analyseendpunkt
- Ein Standardsemantikmodell
Jede gespiegelte Datenbank verfügt über einen automatisch generierten SQL-Analyseendpunkt, der eine umfassende Analyseerfahrung über die durch den Spiegelungsprozess erstellten Delta-Tabellen bietet. Benutzer haben Zugriff auf vertraute T-SQL-Befehle, die Datenobjekte definieren und abfragen können, aber die Daten nicht vom SQL-Analyseendpunkt bearbeiten können, da es sich um eine schreibgeschützte Kopie handelt. Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:
- Erkunden Sie die Tabellen, die auf Daten in Ihren Delta Lake-Tabellen aus Snowflake verweisen.
- Erstellen Sie keine Codeabfragen und -ansichten, und untersuchen Sie Daten visuell, ohne eine Codezeile zu schreiben.
- Entwickeln Sie SQL-Views, Inline-TVFs (Tabellenwertfunktionen) und gespeicherte Prozeduren, um Ihre Semantik und Geschäftslogik in T-SQL zu kapseln.
- Verwalten von Berechtigungen für die Objekte
- Abfragen von Daten in anderen Warehouses und Lakehouses im selben Arbeitsbereich
Zusätzlich zum SQL Query Editor gibt es ein breites Ökosystem von Tools, die den SQL-Analyseendpunkt abfragen können, einschließlich SQL Server Management Studio (SSMS), der mssql-Erweiterung mit Visual Studio Code und sogar GitHub Copilot.
Sicherheitshinweise
Um die Fabric-Spiegelung zu aktivieren, benötigen Sie Benutzerberechtigungen für Ihre Snowflake-Datenbank, die die folgenden Berechtigungen enthalten:
CREATE STREAM
SELECT table
SHOW tables
DESCRIBE tables
Weitere Informationen finden Sie in der Snowflake-Dokumentation zu Zugriffssteuerungsberechtigungen für Streamingtabellen und erforderlichen Berechtigungen für Streams.
Wichtig
Jede granulare Sicherheit, die im Snowflake-Quellwarehouse eingerichtet wurde, muss in der gespiegelten Datenbank in Microsoft Fabric neu konfiguriert werden. Weitere Informationen finden Sie unter detaillierte SQL-Berechtigungen in Microsoft Fabric.
Kostenüberlegungen zur Snowflake-Spiegelung
Fabric-Compute, die zum Replizieren Ihrer Daten in Fabric OneLake verwendet wird, ist kostenlos. Die Speicherkosten für die Spiegelung sind bis zu einem auf der Kapazität basierenden Grenzwert kostenlos. Weitere Informationen finden Sie unter Kosten für die Spiegelung und Microsoft Fabric-Preise. Die Rechenressourcen für das Abfragen von Daten mit SQL, Power BI oder Spark werden zu den regulären Tarifen verrechnet.
Fabric berechnet keine Gebühren für die Erfassung von Netzwerkdaten für die Spiegelung in OneLake.
Es fallen Kosten für Snowflake-Compute- und Cloudabfragen an, wenn Daten gespiegelt werden: Computing für virtuelle Warehouses und Clouddienste.
- Computegebühren für virtuelles Snowflake-Warehouses:
- Die Computegebühren werden aufseiten von Snowflake berechnet, wenn Datenänderungen in Snowflake gelesen und dann in Fabric gespiegelt werden müssen.
- Sämtliche Metadatenabfragen werden im Hintergrund ausgeführt, um zu überprüfen, ob Datenänderungen für Snowflake-Compute nicht berechnet wurden. Abfragen, die Daten erzeugen (z. B.
SELECT *
) wecken hingegen das Snowflake-Warehouse und werden abgerechnet.
- Computegebühren für Snowflake-Dienste:
- Obwohl keine Compute-Gebühren für die Aufgaben hinter den Kulissen anfallen, wie z.B. die Erstellung, Metadatenabfragen, Zugriffskontrolle, Anzeige von Datenänderungen und sogar DDL-Abfragen, fallen für diese Abfragen Cloud-Kosten an.
- Je nachdem, welche Art von Snowflake Edition Sie haben, werden Ihnen die entsprechenden Gutschriften für alle Clouddienstekosten in Rechnung gestellt.
Im folgenden Screenshot können Sie sehen, wie das Computing für virtuelle Warehouses und Clouddienste für die zugeordnete und in Fabric gespiegelte Snowflake-Datenbank berechnet wird. In diesem Szenario entsteht der Großteil der Rechenkosten für Cloud-Dienste (in gelb) durch Anfragen zur Datenänderung, die auf den zuvor genannten Punkten basieren. Die Computegebühren des virtuellen Warehoueses (in Blau) stammen ausschließlich aus den Datenänderungen, die aus Snowflake gelesen und in Fabric gespiegelt werden.
Weitere Informationen zu Snowflake-spezifischen Cloud-Abfragekosten finden Sie unter Snowflake Docs: Grundlegendes zu den Gesamtkosten.