Delen via


Accountactiviteit bewaken met systeemtabellen

In dit artikel wordt het concept van systeemtabellen in Azure Databricks uitgelegd en worden resources gemarkeerd die u kunt gebruiken om optimaal gebruik te maken van uw systeemtabellen.

Wat zijn systeemtabellen?

Systeemtabellen zijn een door Azure Databricks gehoste analytische opslag van de operationele gegevens van uw account die zijn gevonden in de system catalogus. Systeemtabellen kunnen worden gebruikt voor historische waarneembaarheid in uw account.

Notitie

Zie system.information_schemavoor documentatie over .

Vereisten

  • Voor toegang tot systeemtabellen moet uw werkruimte zijn ingeschakeld voor Unity Catalog. Zie Systeemtabelschema's inschakelen voor meer informatie.
  • Systeemtabellen zijn niet beschikbaar in de volgende regio's:
    • Regio's van Azure China
    • Azure-overheidsregio's
    • West-Indië
    • Zwitserland - west

Welke systeemtabellen zijn beschikbaar?

Momenteel host Azure Databricks de volgende systeemtabellen:

Tabel Beschrijving Locatie Ondersteunt streaming Gratis bewaarperiode Bevat globale of regionale gegevens
Auditlogs (openbare voorvertoning) Bevat records voor alle controlegebeurtenissen uit werkruimten in uw regio. Zie Diagnostisch logboek naslag voor een lijst met beschikbare auditgebeurtenissen. system.access.audit Ja 365 dagen Regionaal voor gebeurtenissen op werkruimteniveau. Globaal voor gebeurtenissen op accountniveau.
Tabelafstamming (openbare voorbeeldversie) Bevat een record voor elke lees- of schrijfbeurtenis in een Unity Catalog-tabel of -pad. system.access.table_lineage Ja 365 dagen Regionaal
kolomherkomst (openbare preview) Bevat een record voor elke lees- of schrijfbeurtenis in een Unity Catalog-kolom (maar bevat geen gebeurtenissen die geen bron hebben). system.access.column_lineage Ja 365 dagen Regionaal
Factureerbaar gebruik Bevat records voor alle factureerbare gebruik in uw account. system.billing.usage Ja 365 dagen Globaal
Prijzen Een historisch logboek met SKU-prijzen. Er wordt elke keer een record toegevoegd wanneer er een wijziging is in de prijs van een SKU. system.billing.list_prices Nee Onbeperkt Globaal
Clusters (publieke preview) Een langzaam veranderende dimensietabel die de volledige geschiedenis van rekenconfiguraties in de loop van de tijd voor elk cluster bevat. system.compute.clusters Ja 365 dagen Regionaal
Knooppunt tijdlijn (openbare preview) Hiermee worden de metrische gegevens over het gebruik van uw rekenresources voor alle doeleinden en taken vastgelegd. system.compute.node_timeline Ja 30 dagen Regionaal
Knooppunttypen (openbare preview) Legt de momenteel beschikbare knooppunttypen vast met de basishardwaregegevens. system.compute.node_types Nee N.v.t. Regionaal
SQL-warehouses (Openbare preview) Bevat de volledige geschiedenis van configuraties in de loop van de tijd voor elk SQL-warehouse. system.compute.warehouses Ja 365 dagen Regionaal
SQL Warehouse-gebeurtenissen (publieke preview) Legt gebeurtenissen vast die betrekking hebben op SQL-warehouses. Bijvoorbeeld: starten, stoppen, uitvoeren, omhoog en omlaag schalen. system.compute.warehouse_events Ja 365 dagen Regionaal
Banen (Openbare Preview) Houdt alle taken bij die in het account zijn gemaakt. system.lakeflow.jobs Ja 365 dagen Regionaal
Taakopdrachten (openbare preview) Houdt alle taaktaken bij die worden uitgevoerd in het account. system.lakeflow.job_tasks Ja 365 dagen Regionaal
Tijdlijn voor taakuitvoering (openbare preview) Houdt de begin- en eindtijden van taakuitvoeringen bij. system.lakeflow.
job_run_timeline
Ja 365 dagen Regionaal
Tijdlijn voor taken (openbare preview) Houdt de begin- en eindtijden bij en de computerbronnen die worden gebruikt voor taakuitvoeringen voor opdrachten. system.lakeflow.
job_task_run_timeline
Ja 365 dagen Regionaal
Marketplace-funnelgebeurtenissen (publieke preview) Bevat consumentenindrukken en funnelgegevens voor uw advertenties. system.marketplace.listing_
funnel_events
Ja 365 dagen Regionaal
Toegang tot Marktplaatsvermeldingen (openbare preview) Bevat consumenteninfo voor voltooide aanvraaggegevens of gegevensophaling gebeurtenissen op uw vermeldingen. system.marketplace.listing_
access_events
Ja 365 dagen Regionaal
Voorspellende optimalisatie (openbare preview) Houdt de bewerkingsgeschiedenis van de functie voorspellende optimalisatie bij. system.storage.predictive_
optimization_operations_history
Nee 180 dagen Regionaal
Databricks Assistant-gebeurtenissen (publieke preview) Houdt gebruikersberichten bij die naar de Databricks Assistant worden verzonden. system.access.assistant_events Nee 365 dagen Regionaal
Querygeschiedenis (openbare preview) Registreert records voor alle query's die worden uitgevoerd op SQL-warehouses en serverloze berekeningen voor notebooks en taken. system.query.history Nee 90 dagen Regionaal
Clean room events (openbare preview) Legt gebeurtenissen vast die betrekking hebben op schone ruimten. system.access.clean_room_events Ja 365 dagen Regionaal
Model voor eindpuntgebruik (openbare preview) Hiermee worden tokens vastgelegd voor elke aanvraag naar een modelserver-eindpunt en de bijbehorende antwoorden. Als u het gebruik van het eindpunt in deze tabel wilt vastleggen, moet u het bijhouden van gebruik inschakelen voor het eindpunt van uw service-. system.serving.endpoint_usage. Ja 90 dagen Regionaal
Model voor eindpuntgegevens (openbare preview) Een langzaam veranderende dimensietabel die metagegevens opslaat voor elk geleverd basismodel binnen een model-serveerpunt. system.serving.served_entities Ja 365 dagen Regionaal
gebeurtenissen voor netwerktoegang (openbare preview) Een tabel die een gebeurtenis registreert voor elke keer dat internettoegang wordt geweigerd vanuit uw account. system.access.outbound_network Ja 365 dagen Regionaal

De factureerbare gebruiks- en prijstabellen zijn gratis te gebruiken. Tabellen in openbare preview zijn ook gratis te gebruiken tijdens de preview, maar kunnen in de toekomst kosten in rekening brengen.

Notitie

Mogelijk ziet u andere systeemtabellen in uw account naast de hierboven genoemde tabellen. Deze tabellen bevinden zich momenteel in privévoorbeeld en zijn standaard leeg. Als u geïnteresseerd bent in het gebruik van een van deze tabellen, neemt u contact op met uw Databricks-accountteam.

systeemtabelschema's inschakelen

Omdat systeemtabellen worden beheerd door Unity Catalog, moet u ten minste één werkruimte met Unity Catalog in uw account hebben om systeemtabellen in te schakelen en te openen. Systeemtabellen bevatten gegevens uit alle werkruimten in uw account, maar ze kunnen alleen worden geopend vanuit een werkruimte met Unity Catalog-functionaliteit.

Systeemtabellen worden ingeschakeld op schemaniveau. Als u een systeemschema inschakelt, schakelt u alle tabellen in dat schema in. Wanneer er nieuwe schema's worden vrijgegeven, moet een accountbeheerder het schema handmatig inschakelen.

Systeemtabellen moeten worden ingeschakeld door een accountbeheerder. U kunt systeemtabellen inschakelen met behulp van system-schemas opdrachten in de Databricks CLI- of met behulp van de SystemSchemas-API.

Notitie

Het billing schema is standaard ingeschakeld. Andere schema's moeten handmatig worden ingeschakeld.

Beschikbare systeemschema's weergeven

Gebruik de volgende curl-opdracht om beschikbare systeemschema's weer te geven:

curl -v -X GET -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas"

Hier volgt een voorbeeld van de uitvoer van de GET opdracht:

{"schemas":[{"schema":"access","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"billing","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"information_schema","state":"<AVAILABLE OR EnableCompleted>"}]}

state: AVAILABLE: het systeemschema is beschikbaar, maar is nog niet ingeschakeld.

state: EnableCompleted: u hebt het systeemschema ingeschakeld en is zichtbaar in Catalog Explorer.

Een systeemschema inschakelen

Gebruik de volgende curl-opdracht om een systeemschema in te schakelen:

curl -v -X PUT -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"

Als het systeemschema succesvol is ingeschakeld, wordt resultaatcode 200 geretourneerd.

Als u probeert een systeemschema opnieuw in te schakelen, wordt het volgende geretourneerd: "error_code":"SCHEMA_ALREADY_EXISTS","message":"Schema <schema-name> already exists".

Een systeemschema uitschakelen

Gebruik de volgende curl-opdracht om een systeemschema uit te schakelen:

curl -v -X DELETE -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"

Toegang verlenen tot systeemtabellen

Toegang tot systeemtabellen wordt beheerd door Unity Catalog. Gebruikers hebben standaard geen toegang tot deze systeemschema's. Als u toegang wilt verlenen, moet een gebruiker die zowel een metastore-beheerder als een accountbeheerder is, USE en SELECT machtigingen verlenen voor de systeemschema's. Zie Bevoegdheden beheren in Unity Catalog.

Systeemtabellen zijn alleen voor lezen en kunnen niet worden gewijzigd.

Notitie

Als uw account is gemaakt na 9 november 2023, hebt u mogelijk geen metastore-beheerder standaard. Zie Unity Catalog instellen en beherenvoor meer informatie.

Bevatten systeemtabellen gegevens voor alle werkruimten in uw account?

Systeemtabellen bevatten operationele gegevens voor alle werkruimten in uw account die zijn geïmplementeerd in dezelfde cloudregio. Factureringssysteemtabellen bevatten accountbrede gegevens.

Hoewel systeemtabellen alleen toegankelijk zijn via een Unity Catalog-werkruimte, bevatten de tabellen ook operationele gegevens voor de niet-Unity Catalog-werkruimten in uw account.

Waar worden systeemtabelgegevens opgeslagen?

De systeemtabelgegevens van uw account worden opgeslagen in een door Azure Databricks gehost opslagaccount in dezelfde regio als uw metastore. De gegevens worden veilig met u gedeeld met behulp van Delta Sharing.

Elke tabel heeft een gratis bewaarperiode voor gegevens. Neem contact op met uw Azure Databricks-accountteam voor informatie over het verlengen van de bewaarperiode.

Waar bevinden zich systeemtabellen in Catalog Explorer?

De systeemtabellen in uw account bevinden zich in een catalogus met de naam system, die is opgenomen in elke Unity Catalog-metastore. In de system-catalogus ziet u schema's zoals access en billing die de systeemtabellen bevatten.

Overwegingen voor streamingsysteemtabellen

Azure Databricks maakt gebruik van Delta Sharing om systeemtabelgegevens te delen met klanten. Houd rekening met de volgende overwegingen bij het streamen met Delta Sharing:

  • Als u streaming gebruikt met systeemtabellen, stelt u de optie skipChangeCommits in op true. Dit zorgt ervoor dat de streamingtaak niet wordt onderbroken door verwijderingen in de systeemtabellen. Zie Negeer updates en verwijderingen.
  • Trigger.AvailableNow wordt niet ondersteund met Delta Sharing-streaming. Het wordt geconverteerd naar Trigger.Once.

Als u een trigger in uw streamingopdracht gebruikt en merkt dat deze niet de nieuwste versie van de systeemtabel bereikt, raadt Databricks aan om de geplande frequentie van de opdracht te verhogen.

Incrementele wijzigingen lezen uit streamingsysteemtabellen

spark.readStream.option("skipChangeCommits", "true").table("system.billing.usage")

Bekende problemen

  • Momenteel is er geen ondersteuning voor realtime bewaking. Gegevens worden de hele dag bijgewerkt. Als u geen logboek ziet voor een recente gebeurtenis, controleert u het later opnieuw.
  • Het __internal_logging systeemtabelschema wordt gebruikt om payload-logging te ondersteunen met behulp van inference-tabellen met AI Gateway voor externe modellen en geconfigureerde doorvoerworkloads. Dit schema is zichtbaar voor accountbeheerders, maar kan niet worden ingeschakeld en mag niet worden gebruikt voor klantwerkstromen.
  • Als u systeemtabellen wilt inschakelen, moet u mogelijk netwerktoegang verlenen tot het Blob Storage-eindpunt van de systeemtabellen. Raadpleeg IP-adressen van opslageindpuntenvoor een lijst van de opslageindpunten van de systeemtabellen van elke regio.
  • De systeemschema's system.operational_data en system.lineage zijn afgeschaft en bevatten lege tabellen.