Tilgængelighed af Eventhouse OneLake
Du kan oprette en logisk kopi af KQL-databasedata i et hændelseshus ved at aktivere OneLake-tilgængelighed. Hvis onelake-tilgængelighed aktiveres, betyder det, at du kan forespørge dataene i din KQL-database i Delta Lake-format via andre Fabric-motorer, f.eks. Direct Lake-tilstand i Power BI, Warehouse, Lakehouse, Notesbøger og meget mere.
Delta Lake er et samlet tabelformat til datasøer, der giver problemfri dataadgang på tværs af alle beregningsprogrammer i Microsoft Fabric. Du kan få flere oplysninger om Delta Lake under Hvad er Delta Lake?.
I denne artikel får du mere at vide om, hvordan du aktiverer tilgængeligheden af KQL-databasedata i OneLake.
Sådan fungerer det
Du kan aktivere OneLake-tilgængelighed på database- eller tabelniveau. Når indstillingen er aktiveret på databaseniveau, gøres alle nye tabeller og deres data tilgængelige i OneLake. Når du aktiverer funktionen, kan du også vælge at anvende denne indstilling på eksisterende tabeller ved at vælge indstillingen Anvend på eksisterende tabeller. Når du aktiverer på tabelniveau, er det kun den pågældende tabel og dens data, der er tilgængelige i OneLake. Politikken for dataopbevaring for din KQL-database anvendes også på dataene i OneLake. Data, der er fjernet fra din KQL-database ved slutningen af opbevaringsperioden, fjernes også fra OneLake. Hvis du slår OneLake-tilgængelighed fra, slettes data blødt fra OneLake.
Selvom OneLake-tilgængelighed er slået til, kan du ikke udføre følgende opgaver:
- Omdøb tabeller
- Rediger tabelskemaer
- Anvend sikkerhed på rækkeniveau på tabeller
- Data kan ikke slettes, afkortes eller fjernes
Hvis du har brug for at udføre nogen af disse opgaver, skal du benytte følgende fremgangsmåde:
Vigtigt
Hvis du slår tilgængeligheden OneLake fra sletter dine data fra OneLake. Når du slår tilgængeligheden til igen, er det kun nye data, der gøres tilgængelige i OneLake uden backfill af de slettede data.
Deaktiver tilgængeligheden OneLake.
Udfør den ønskede opgave.
Slå tilgængeligheden OneLake til.
Vigtigt
Du kan få flere oplysninger om, hvor lang tid det tager for data at blive vist i OneLake, under adaptiv funktionsmåde.
Der er ingen ekstra lageromkostninger til at aktivere OneLake-tilgængelighed. Du kan få flere oplysninger under Ressourceforbrug.
Forudsætninger
- Et arbejdsområde med en Microsoft Fabric-aktiveret kapacitet
- En KQL-database med redigeringstilladelser og data
Slå Tilgængelighed af OneLake til
Du kan aktivere OneLake-tilgængelighed enten på en KQL-database eller på tabelniveau.
Hvis du vil aktivere OneLake-tilgængelighed, skal du gå til afsnittet OneLake i detaljeruden i din KQL-database eller -tabel.
Angiv Tilgængelighed til Til.
Databasen opdateres automatisk.
Du har aktiveret OneLake-tilgængelighed i din KQL-database. Du kan nu få adgang til alle de nye data, der er føjet til databasen, på den angivne OneLake-sti i Delta Lake-format. Du kan også vælge at oprette en OneLake-genvej fra Lakehouse, Data Warehouse eller forespørge dataene direkte via Power BI Direct Lake-tilstand.
Tilpasset funktionsmåde
Eventhouse tilbyder en robust mekanisme, der på intelligent vis bundter indgående datastrømme i en eller flere Parquet-filer, der er struktureret til analyse. Batching af datastrømme er vigtig, når du arbejder med trickling af data. Det kan være ineffektivt at skrive mange små parquetfiler i søen, hvilket kan resultere i højere omkostninger og dårlig ydeevne.
Eventhouses adaptive mekanisme kan forsinke skrivehandlinger, hvis der ikke er nok data til at oprette optimale Parquet-filer. Dette sikrer, at Parquet-filer er optimale i størrelse og overholder bedste praksis for Delta Lake. Eventhouse-tilpasningsmekanismen sikrer, at Parquet-filerne er klar til analyse og balancerer behovet for hurtig datatilgængelighed med overvejelser om omkostninger og ydeevne.
Bemærk
- Skrivehandlingen kan som standard tage op til 3 timer, eller indtil der oprettes filer med en tilstrækkelig størrelse (typisk 200-256 MB).
- Du kan justere forsinkelsen til en værdi mellem 5 minutter og 3 timer.
Brug f.eks. følgende kommando til at angive forsinkelsen til 5 minutter:
.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);
Forsigtighed
Hvis du justerer forsinkelsen til en kortere periode, kan det resultere i en ikke-optimal deltatabel med et stort antal små filer, hvilket kan føre til ineffektiv forespørgselsydeevne. Den resulterende tabel i OneLake er skrivebeskyttet og kan ikke optimeres efter oprettelsen.
Du kan overvåge, hvor længe der er blevet tilføjet nye data i søen, ved at kontrollere din dataventetid ved hjælp af kommandoen .show table mirroring operations kommando.
Resultaterne måles fra sidste gang, der blev tilføjet data. Når ventetiden resulterer i 00:00:00, er alle dataene i KQL-databasen tilgængelige i OneLake.
Få vist filer
Når du slår OneLake-tilgængelighed til i en tabel, oprettes der en deltalogmappe sammen med alle tilsvarende JSON- og Parquet-filer. Du kan få vist de filer, der er gjort tilgængelige i OneLake, og deres egenskaber, mens de forbliver i realtidsintelligens.
Hvis du vil have vist filerne, skal du holde markøren over en tabel i ruden Stifinder og derefter vælge menuen Mere [...]>Vis filer.
Hvis du vil have vist egenskaberne for deltalogmappen eller de enkelte filer, skal du holde markøren over mappen eller filen og derefter vælge menuen Flere [...]>Egenskaber.
Sådan får du vist filerne i deltalogmappen:
- Vælg mappen _delta_log .
- Vælg en fil for at få vist tabelmetadata og -skema. Den editor, der åbnes, er i skrivebeskyttet format.
Få adgang til spejlingspolitik
Når Tilgængeligheden af OneLake er slået til, er en spejlingspolitik som standard aktiveret. Du kan bruge politikken til at overvåge dataventetid eller ændre den til partitionsdeltatabeller.
Bemærk
Hvis du slår Tilgængelighed af OneLake fra
Partitionsdeltatabeller
Du kan partitionere dine deltatabeller for at forbedre forespørgselshastigheden. Du kan få oplysninger om, hvornår du skal partitionere Dine OneLake-filer, under Hvornår skal du partitionere tabeller. Hver partition repræsenteres som en separat kolonne ved hjælp af PartitionName, der er angivet på listen Partitioner. Det betyder, at din OneLake-kopi har flere kolonner end din kildetabel.
Hvis du vil partitionere deltatabellerne, skal du bruge spejlingskommandoen .alter-merge table.
Relateret indhold
- Hvis du vil vise dataene i OneLake, skal du se Opret en genvej i OneLake
- Hvis du vil oprette en OneLake-genvej i Lakehouse, skal du se Hvad er genveje i lakehouse?
- Hvis du vil forespørge om data fra OneLake i din KQL-database eller -tabel, skal du se Opret en OneLake-genvej i KQL-database