Referentie voor factureerbaar gebruik van systeemtabel

Artikel
03/05/2025

Dit artikel bevat een overzicht van de factureerbare gebruikssysteemtabel, inclusief het schema en voorbeeldquery's. Met systeemtabellen worden de factureerbare gebruiksgegevens van uw account gecentraliseerd en doorgestuurd naar alle regio's, zodat u het globale gebruik van uw account kunt bekijken vanuit de regio waarin uw werkruimte zich bevindt.

Zie Kosten bewaken met behulp van systeemtabellenvoor meer informatie over het gebruik van deze tabel voor het bewaken van kosten en voorbeeldquery's.

tabelpad: deze systeemtabel bevindt zich op system.billing.usage.

Factureerbare gebruikstabelschema

De tabel van het gebruiksfactureringssysteem gebruikt het volgende schema:

Kolomnaam	Gegevenstype	Beschrijving	Voorbeeld
`record_id`	tekenreeks	Unieke id voor deze gebruiksrecord	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	tekenreeks	Id van het account waarvoor dit rapport is gegenereerd	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	tekenreeks	Id van de werkruimte waarmee dit gebruik is gekoppeld	`1234567890123456`
`sku_name`	tekenreeks	Naam van de SKU	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	tekenreeks	Cloud gekoppeld aan dit gebruik. Mogelijke waarden zijn `AWS`, `AZURE`en `GCP`.	`AWS`, `AZURE` of `GCP`
`usage_start_time`	tijdstempel	De begintijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met `+00:00` die UTC-tijdzone vertegenwoordigen.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	tijdstempel	De eindtijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met `+00:00` die UTC-tijdzone vertegenwoordigen.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	datum	Datum van de gebruiksrecord, dit veld kan worden gebruikt voor snellere aggregatie op datum	`2023-01-01`
`custom_tags`	kaart	Aangepaste tags die zijn gekoppeld aan de gebruiksrecord	`{ “env”: “production” }`
`usage_unit`	tekenreeks	Eenheid waarin dit gebruik wordt gemeten	`DBU`
`usage_quantity`	decimaal	Aantal verbruikte eenheden voor deze record	`259.2958`
`usage_metadata`	struct	Door het systeem verstrekte metagegevens over het gebruik, inclusief id's voor rekenresources en taken (indien van toepassing). Zie Metagegevens van gebruik.	`{cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}`
`identity_metadata`	struct	Door het systeem verstrekte metagegevens over de identiteiten die betrokken zijn bij het gebruik. Zie identiteitsmetagegevens.	Raadpleeg Identiteitsmetagegevens
`record_type`	tekenreeks	Of het record origineel, een intrekking of een herformulering is. De waarde is `ORIGINAL` tenzij de record is gerelateerd aan een correctie. Zie Recordtype.	`ORIGINAL`
`ingestion_date`	datum	Datum waarop de record is opgenomen in de `usage` tabel	`2024-01-01`
`billing_origin_product`	tekenreeks	Het product dat het gebruik heeft geïnitieerd. Sommige producten kunnen worden gefactureerd als verschillende SKU's. Zie Productvoor mogelijke waarden.	`JOBS`
`product_features`	Struct	Details over de specifieke productfuncties die worden gebruikt. Zie Producteigenschappen.	Zie Producteigenschappen
`usage_type`	tekenreeks	Het type gebruik dat is toegewezen aan het product of de workload voor factureringsdoeleinden. Mogelijke waarden zijn `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTES`, `NETWORK_HOUR`, `API_OPERATION`, `TOKEN`of `GPU_TIME`.	`STORAGE_SPACE`

Referentie voor gebruiksmetadata

De waarden in usage_metadata vertellen u over de objecten en resources die betrokken zijn bij de gebruiksregistratie.

Waarde	Gegevenstype	Beschrijving
`cluster_id`	tekenreeks	ID van het cluster dat is gekoppeld aan de gebruiksregistratie
`warehouse_id`	tekenreeks	Id van het SQL-warehouse dat is gekoppeld aan de gebruiksrecord
`instance_pool_id`	tekenreeks	ID van de instancepool die is gekoppeld aan de gebruiksregistratie
`node_type`	tekenreeks	Het exemplaartype van de rekenresource
`job_id`	tekenreeks	Id van de taak die is gekoppeld aan de gebruiksrecord. Retourneert alleen een waarde voor het rekengebruik van serverloze berekeningen of taken, anders wordt geretourneerd `null`.
`job_run_id`	tekenreeks	Id van de taakuitvoering die is gekoppeld aan de gebruiksrecord. Geeft alleen een waarde terug voor serverloze compute of jobs compute-gebruik, anders wordt `null` geretourneerd.
`job_name`	tekenreeks	Door de gebruiker opgegeven naam van de taak die is gekoppeld aan de gebruiksrecord. Retourneert alleen een waarde voor taken die worden uitgevoerd op serverloze berekeningen, anders wordt geretourneerd `null`.
`notebook_id`	tekenreeks	ID van het notitieblok dat is gekoppeld aan het gebruik ervan. Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert `null`.
`notebook_path`	tekenreeks	Werkruimteopslagpad van het notebook dat is gekoppeld aan het gebruik. Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert `null`.
`dlt_pipeline_id`	tekenreeks	ID van de DLT-pijplijn die is gekoppeld aan de gebruiksgegevens
`dlt_update_id`	tekenreeks	Id van de DLT-pijplijnupdate die is gekoppeld aan de gebruiksrecord
`dlt_maintenance_id`	tekenreeks	ID van de onderhoudstaken voor DLT-pijplijnen die zijn gekoppeld aan het gebruiksrecord
`run_name`	tekenreeks	Unieke gebruikersgerichte identificatie van de Foundation Model Fine-tuning die is geassocieerd met de gebruiksrecord.
`endpoint_name`	tekenreeks	De naam van het model-serveer-eindpunt of vectorzoek-eindpunt dat is gekoppeld aan de gebruikersrecord
`endpoint_id`	tekenreeks	Id van het model dat eindpunt of vectorzoekeindpunt bedient dat is gekoppeld aan de gebruiksrecord
`central_clean_room_id`	tekenreeks	ID van de centrale clean room die is gekoppeld aan de gebruiksregistratie
`source_region`	string	Regio van de werkruimte die is gekoppeld aan het gebruik. Retourneert alleen een waarde voor netwerkgerelateerde kosten.
`destination_region`	tekenreeks	Regio van de bron die wordt benaderd. Retourneert alleen een waarde voor netwerkgerelateerde kosten.
`metastore_id`	tekenreeks	ID (identificatie) van de metastore die is gekoppeld aan de gebruiksregistratie
`app_id`	tekenreeks	Id van de app die is gekoppeld aan de gebruiksrecord
`app_name`	tekenreeks	Door de gebruiker opgegeven naam van de app die is gekoppeld aan de gebruiksrecord
`private_endpoint_name`	tekenreeks	Naam van het toepasselijke privé-eindpunt. Retourneert alleen een waarde voor netwerkgerelateerde kosten.

naslaginformatie voor metagegevens van identiteit

De kolom identity_metadata bevat meer informatie over de identiteiten die betrokken zijn bij het gebruik. Het run_as veld logt wie de workload heeft uitgevoerd. Het veld owned_by is alleen van toepassing op het gebruik van SQL Warehouse en registreert de gebruiker of service-principal die eigenaar is van het SQL-magazijn dat verantwoordelijk is voor het gebruik.

Daarnaast logt het aan Databricks Apps toegeschreven gebruik een waarde in het veld identity_metadata.created_by. Deze waarde wordt gevuld met het e-mailadres van de gebruiker die de app heeft gemaakt.

identiteiten run_as

De in identity_metadata.run_as vastgelegde identiteit is afhankelijk van het product dat aan het gebruik is gekoppeld. Raadpleeg de volgende tabel voor het identity_metadata.run_as gedrag:

Workload type	Identiteit van `run_as`
Taakverwerking	De gebruiker of service-principal die in de `run_as` instelling is gedefinieerd. Taken worden standaard uitgevoerd als de persoon van de taakeigenaar, maar beheerders kunnen dit wijzigen naar een andere gebruiker of service-principal.
Serverloze rekenkracht voor taken	De in de `run_as` instelling gedefinieerde gebruiker of service-principal. Standaard worden taken uitgevoerd onder de identiteit van de taakeigenaar, maar beheerders kunnen dit wijzigen naar een andere gebruiker of service-principal.
Serverloze rekenkracht voor notebooks	De gebruiker die de notebookopdrachten heeft uitgevoerd (met name de gebruiker die de notebooksessie heeft gemaakt). Voor gedeelde notitieblokken omvat dit gebruik door andere gebruikers die dezelfde sessie delen.
DLT-pijplijnen	De gebruiker van wie de machtigingen worden gebruikt om de DLT-pijplijn uit te voeren. Dit kan worden gewijzigd door het eigendom van de pijplijn over te dragen.
Fijnstelling van het Fundamentele Model	De gebruiker of service-principal die de trainingsuitvoering heeft geïnitieerd.
Voorspellende optimalisatie	De service-principal die eigendom is van Databricks en voorspellende optimalisatiebewerkingen uitvoert.
Lakehouse-bewaking	De gebruiker die de monitor heeft gemaakt.

verwijzing naar recordtype

De billing.usage tabel ondersteunt correcties. Correcties treden op wanneer een veld van de gebruiksrecord onjuist is en moet worden opgelost.

Wanneer er een correctie plaatsvindt, voegt Azure Databricks twee nieuwe records toe aan de tabel. Een intrekkingsvermelding annuleert de oorspronkelijke onjuiste vermelding, waarna een herziening de gecorrigeerde informatie bevat. Correctierecords worden geïdentificeerd met behulp van het record_type veld:

RETRACTION: Wordt gebruikt om het oorspronkelijke onjuiste gebruik te vernieten. Alle velden zijn identiek aan de ORIGINAL record, behalve usage_quantityeen negatieve waarde die de oorspronkelijke gebruikshoeveelheid annuleert. Als de gebruikshoeveelheid van de oorspronkelijke record bijvoorbeeld was 259.4356, zou de intrekkingsrecord een gebruikshoeveelheid van -259.4356hebben.
RESTATEMENT: De record met de juiste velden en gebruikshoeveelheid.

De volgende query retourneert bijvoorbeeld de juiste hoeveelheid per uur met betrekking tot een job_id, zelfs als er correcties zijn aangebracht. Door de gebruikshoeveelheid te aggregeren, wordt het oorspronkelijke record door de correctieregistratie ongedaan gemaakt en worden alleen de waarden van de herformulering geretourneerd.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Notitie

Voor correcties waarbij de oorspronkelijke gebruiksrecord niet mag zijn geschreven, kan een correctie alleen een intrekkingsrecord en geen aanpassingsrecord toevoegen.

productreferentie voor factureringsoorsprong

Sommige Databricks-producten worden gefactureerd onder dezelfde gedeelde SKU. Om u te helpen onderscheid te maken tussen het gebruik, bieden de kolommen billing_origin_product en product_features meer inzicht in het specifieke product en de specifieke functies die aan het gebruik zijn gekoppeld.

In de kolom billing_origin_product ziet u het Databricks-product dat is gekoppeld aan de gebruiksrecord. De waarden zijn onder andere:

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL

NETWORKING: kosten die zijn gekoppeld aan het verbinden van serverloze rekenkracht met uw resources via privé-eindpunten. Voor NETWORKING gebruik is workspace_idnull, usage_unit is houren networking.connectivity_typePRIVATE_IP.
APPS: kosten voor het bouwen en uitvoeren van Databricks-apps

Overzicht van productkenmerken

De kolom product_features is een object met informatie over de specifieke productfuncties die worden gebruikt en bevat de volgende sleutel-/waardeparen:

jobs_tier: waarden zijn onder andere LIGHT, CLASSICof null
sql_tier: waarden zijn onder andere CLASSIC, PROof null
dlt_tier: waarden zijn onder andere CORE, PRO, ADVANCEDof null
is_serverless: waarden zijn true of falseof null
is_photon: waarden zijn true of falseof null
serving_type: waarden zijn onder andere MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREof null

networking.connectivity_type: waarden zijn onder andere PUBLIC_IP en PRIVATE_IP

Delen via