Delen via


Referentie voor factureerbaar gebruik van systeemtabel

Dit artikel bevat een overzicht van de factureerbare gebruikssysteemtabel, inclusief het schema en voorbeeldquery's. Met systeemtabellen worden de factureerbare gebruiksgegevens van uw account gecentraliseerd en doorgestuurd naar alle regio's, zodat u het globale gebruik van uw account kunt bekijken vanuit de regio waarin uw werkruimte zich bevindt.

Zie Kosten bewaken met behulp van systeemtabellenvoor meer informatie over het gebruik van deze tabel voor het bewaken van kosten en voorbeeldquery's.

tabelpad: deze systeemtabel bevindt zich op system.billing.usage.

Factureerbare gebruikstabelschema

De tabel van het gebruiksfactureringssysteem gebruikt het volgende schema:

Kolomnaam Gegevenstype Beschrijving Voorbeeld
record_id tekenreeks Unieke id voor deze gebruiksrecord 11e22ba4-87b9-4cc2-9770-d10b894b7118
account_id tekenreeks Id van het account waarvoor dit rapport is gegenereerd 23e22ba4-87b9-4cc2-9770-d10b894b7118
workspace_id tekenreeks Id van de werkruimte waarmee dit gebruik is gekoppeld 1234567890123456
sku_name tekenreeks Naam van de SKU STANDARD_ALL_PURPOSE_COMPUTE
cloud tekenreeks Cloud gekoppeld aan dit gebruik. Mogelijke waarden zijn AWS, AZUREen GCP. AWS, AZURE of GCP
usage_start_time tijdstempel De begintijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met +00:00 die UTC-tijdzone vertegenwoordigen. 2023-01-09 10:00:00.000+00:00
usage_end_time tijdstempel De eindtijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met +00:00 die UTC-tijdzone vertegenwoordigen. 2023-01-09 11:00:00.000+00:00
usage_date datum Datum van de gebruiksrecord, dit veld kan worden gebruikt voor snellere aggregatie op datum 2023-01-01
custom_tags kaart Aangepaste tags die zijn gekoppeld aan de gebruiksrecord { “env”: “production” }
usage_unit tekenreeks Eenheid waarin dit gebruik wordt gemeten DBU
usage_quantity decimaal Aantal verbruikte eenheden voor deze record 259.2958
usage_metadata struct Door het systeem verstrekte metagegevens over het gebruik, inclusief id's voor rekenresources en taken (indien van toepassing). Zie Metagegevens van gebruik. {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}
identity_metadata struct Door het systeem verstrekte metagegevens over de identiteiten die betrokken zijn bij het gebruik. Zie identiteitsmetagegevens. Raadpleeg Identiteitsmetagegevens
record_type tekenreeks Of het record origineel, een intrekking of een herformulering is. De waarde is ORIGINAL tenzij de record is gerelateerd aan een correctie. Zie Recordtype. ORIGINAL
ingestion_date datum Datum waarop de record is opgenomen in de usage tabel 2024-01-01
billing_origin_product tekenreeks Het product dat het gebruik heeft geïnitieerd. Sommige producten kunnen worden gefactureerd als verschillende SKU's. Zie Productvoor mogelijke waarden. JOBS
product_features Struct Details over de specifieke productfuncties die worden gebruikt. Zie Producteigenschappen. Zie Producteigenschappen
usage_type tekenreeks Het type gebruik dat is toegewezen aan het product of de workload voor factureringsdoeleinden. Mogelijke waarden zijn COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTES, NETWORK_HOUR, API_OPERATION, TOKENof GPU_TIME. STORAGE_SPACE

Referentie voor gebruiksmetadata

De waarden in usage_metadata vertellen u over de objecten en resources die betrokken zijn bij de gebruiksregistratie.

Waarde Gegevenstype Beschrijving
cluster_id tekenreeks ID van het cluster dat is gekoppeld aan de gebruiksregistratie
warehouse_id tekenreeks Id van het SQL-warehouse dat is gekoppeld aan de gebruiksrecord
instance_pool_id tekenreeks ID van de instancepool die is gekoppeld aan de gebruiksregistratie
node_type tekenreeks Het exemplaartype van de rekenresource
job_id tekenreeks Id van de taak die is gekoppeld aan de gebruiksrecord. Retourneert alleen een waarde voor het rekengebruik van serverloze berekeningen of taken, anders wordt geretourneerd null.
job_run_id tekenreeks Id van de taakuitvoering die is gekoppeld aan de gebruiksrecord. Geeft alleen een waarde terug voor serverloze compute of jobs compute-gebruik, anders wordt null geretourneerd.
job_name tekenreeks Door de gebruiker opgegeven naam van de taak die is gekoppeld aan de gebruiksrecord. Retourneert alleen een waarde voor taken die worden uitgevoerd op serverloze berekeningen, anders wordt geretourneerd null.
notebook_id tekenreeks ID van het notitieblok dat is gekoppeld aan het gebruik ervan. Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert null.
notebook_path tekenreeks Werkruimteopslagpad van het notebook dat is gekoppeld aan het gebruik. Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert null.
dlt_pipeline_id tekenreeks ID van de DLT-pijplijn die is gekoppeld aan de gebruiksgegevens
dlt_update_id tekenreeks Id van de DLT-pijplijnupdate die is gekoppeld aan de gebruiksrecord
dlt_maintenance_id tekenreeks ID van de onderhoudstaken voor DLT-pijplijnen die zijn gekoppeld aan het gebruiksrecord
run_name tekenreeks Unieke gebruikersgerichte identificatie van de Foundation Model Fine-tuning die is geassocieerd met de gebruiksrecord.
endpoint_name tekenreeks De naam van het model-serveer-eindpunt of vectorzoek-eindpunt dat is gekoppeld aan de gebruikersrecord
endpoint_id tekenreeks Id van het model dat eindpunt of vectorzoekeindpunt bedient dat is gekoppeld aan de gebruiksrecord
central_clean_room_id tekenreeks ID van de centrale clean room die is gekoppeld aan de gebruiksregistratie
source_region string Regio van de werkruimte die is gekoppeld aan het gebruik. Retourneert alleen een waarde voor netwerkgerelateerde kosten.
destination_region tekenreeks Regio van de bron die wordt benaderd. Retourneert alleen een waarde voor netwerkgerelateerde kosten.
metastore_id tekenreeks ID (identificatie) van de metastore die is gekoppeld aan de gebruiksregistratie
app_id tekenreeks Id van de app die is gekoppeld aan de gebruiksrecord
app_name tekenreeks Door de gebruiker opgegeven naam van de app die is gekoppeld aan de gebruiksrecord
private_endpoint_name tekenreeks Naam van het toepasselijke privé-eindpunt. Retourneert alleen een waarde voor netwerkgerelateerde kosten.

naslaginformatie voor metagegevens van identiteit

De kolom identity_metadata bevat meer informatie over de identiteiten die betrokken zijn bij het gebruik. Het run_as veld logt wie de workload heeft uitgevoerd. Het veld owned_by is alleen van toepassing op het gebruik van SQL Warehouse en registreert de gebruiker of service-principal die eigenaar is van het SQL-magazijn dat verantwoordelijk is voor het gebruik.

Daarnaast logt het aan Databricks Apps toegeschreven gebruik een waarde in het veld identity_metadata.created_by. Deze waarde wordt gevuld met het e-mailadres van de gebruiker die de app heeft gemaakt.

identiteiten run_as

De in identity_metadata.run_as vastgelegde identiteit is afhankelijk van het product dat aan het gebruik is gekoppeld. Raadpleeg de volgende tabel voor het identity_metadata.run_as gedrag:

Workload type Identiteit van run_as
Taakverwerking De gebruiker of service-principal die in de run_as instelling is gedefinieerd. Taken worden standaard uitgevoerd als de persoon van de taakeigenaar, maar beheerders kunnen dit wijzigen naar een andere gebruiker of service-principal.
Serverloze rekenkracht voor taken De in de run_as instelling gedefinieerde gebruiker of service-principal. Standaard worden taken uitgevoerd onder de identiteit van de taakeigenaar, maar beheerders kunnen dit wijzigen naar een andere gebruiker of service-principal.
Serverloze rekenkracht voor notebooks De gebruiker die de notebookopdrachten heeft uitgevoerd (met name de gebruiker die de notebooksessie heeft gemaakt). Voor gedeelde notitieblokken omvat dit gebruik door andere gebruikers die dezelfde sessie delen.
DLT-pijplijnen De gebruiker van wie de machtigingen worden gebruikt om de DLT-pijplijn uit te voeren. Dit kan worden gewijzigd door het eigendom van de pijplijn over te dragen.
Fijnstelling van het Fundamentele Model De gebruiker of service-principal die de trainingsuitvoering heeft geïnitieerd.
Voorspellende optimalisatie De service-principal die eigendom is van Databricks en voorspellende optimalisatiebewerkingen uitvoert.
Lakehouse-bewaking De gebruiker die de monitor heeft gemaakt.

verwijzing naar recordtype

De billing.usage tabel ondersteunt correcties. Correcties treden op wanneer een veld van de gebruiksrecord onjuist is en moet worden opgelost.

Wanneer er een correctie plaatsvindt, voegt Azure Databricks twee nieuwe records toe aan de tabel. Een intrekkingsvermelding annuleert de oorspronkelijke onjuiste vermelding, waarna een herziening de gecorrigeerde informatie bevat. Correctierecords worden geïdentificeerd met behulp van het record_type veld:

  • RETRACTION: Wordt gebruikt om het oorspronkelijke onjuiste gebruik te vernieten. Alle velden zijn identiek aan de ORIGINAL record, behalve usage_quantityeen negatieve waarde die de oorspronkelijke gebruikshoeveelheid annuleert. Als de gebruikshoeveelheid van de oorspronkelijke record bijvoorbeeld was 259.4356, zou de intrekkingsrecord een gebruikshoeveelheid van -259.4356hebben.
  • RESTATEMENT: De record met de juiste velden en gebruikshoeveelheid.

De volgende query retourneert bijvoorbeeld de juiste hoeveelheid per uur met betrekking tot een job_id, zelfs als er correcties zijn aangebracht. Door de gebruikshoeveelheid te aggregeren, wordt het oorspronkelijke record door de correctieregistratie ongedaan gemaakt en worden alleen de waarden van de herformulering geretourneerd.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Notitie

Voor correcties waarbij de oorspronkelijke gebruiksrecord niet mag zijn geschreven, kan een correctie alleen een intrekkingsrecord en geen aanpassingsrecord toevoegen.

productreferentie voor factureringsoorsprong

Sommige Databricks-producten worden gefactureerd onder dezelfde gedeelde SKU. Om u te helpen onderscheid te maken tussen het gebruik, bieden de kolommen billing_origin_product en product_features meer inzicht in het specifieke product en de specifieke functies die aan het gebruik zijn gekoppeld.

In de kolom billing_origin_product ziet u het Databricks-product dat is gekoppeld aan de gebruiksrecord. De waarden zijn onder andere:

  • JOBS
  • DLT
  • SQL
  • ALL_PURPOSE
  • MODEL_SERVING
  • INTERACTIVE
  • DEFAULT_STORAGE
  • VECTOR_SEARCH
  • LAKEHOUSE_MONITORING
  • PREDICTIVE_OPTIMIZATION
  • ONLINE_TABLES
  • FOUNDATION_MODEL_TRAINING
  • AGENT_EVALUATION
  • FINE_GRAIN_ACCESS_CONTROL
  • NETWORKING: kosten die zijn gekoppeld aan het verbinden van serverloze rekenkracht met uw resources via privé-eindpunten. Voor NETWORKING gebruik is workspace_idnull, usage_unit is houren networking.connectivity_typePRIVATE_IP.
  • APPS: kosten voor het bouwen en uitvoeren van Databricks-apps

Overzicht van productkenmerken

De kolom product_features is een object met informatie over de specifieke productfuncties die worden gebruikt en bevat de volgende sleutel-/waardeparen:

  • jobs_tier: waarden zijn onder andere LIGHT, CLASSICof null
  • sql_tier: waarden zijn onder andere CLASSIC, PROof null
  • dlt_tier: waarden zijn onder andere CORE, PRO, ADVANCEDof null
  • is_serverless: waarden zijn true of falseof null
  • is_photon: waarden zijn true of falseof null
  • serving_type: waarden zijn onder andere MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREof null
  • networking.connectivity_type: waarden zijn onder andere PUBLIC_IP en PRIVATE_IP