Referentie voor factureerbaar gebruik van systeemtabel
Dit artikel bevat een overzicht van de factureerbare gebruikssysteemtabel, inclusief het schema en voorbeeldquery's. Met systeemtabellen worden de factureerbare gebruiksgegevens van uw account gecentraliseerd en doorgestuurd naar alle regio's, zodat u het globale gebruik van uw account kunt bekijken vanuit de regio waarin uw werkruimte zich bevindt.
Zie Kosten bewaken met behulp van systeemtabellenvoor meer informatie over het gebruik van deze tabel voor het bewaken van kosten en voorbeeldquery's.
tabelpad: deze systeemtabel bevindt zich op system.billing.usage
.
Factureerbare gebruikstabelschema
De tabel van het gebruiksfactureringssysteem gebruikt het volgende schema:
Kolomnaam | Gegevenstype | Beschrijving | Voorbeeld |
---|---|---|---|
record_id |
tekenreeks | Unieke id voor deze gebruiksrecord | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
tekenreeks | Id van het account waarvoor dit rapport is gegenereerd | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
tekenreeks | Id van de werkruimte waarmee dit gebruik is gekoppeld | 1234567890123456 |
sku_name |
tekenreeks | Naam van de SKU | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
tekenreeks | Cloud gekoppeld aan dit gebruik. Mogelijke waarden zijn AWS , AZURE en GCP . |
AWS , AZURE of GCP |
usage_start_time |
tijdstempel | De begintijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met +00:00 die UTC-tijdzone vertegenwoordigen. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
tijdstempel | De eindtijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met +00:00 die UTC-tijdzone vertegenwoordigen. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
datum | Datum van de gebruiksrecord, dit veld kan worden gebruikt voor snellere aggregatie op datum | 2023-01-01 |
custom_tags |
kaart | Aangepaste tags die zijn gekoppeld aan de gebruiksrecord | { “env”: “production” } |
usage_unit |
tekenreeks | Eenheid waarin dit gebruik wordt gemeten | DBU |
usage_quantity |
decimaal | Aantal verbruikte eenheden voor deze record | 259.2958 |
usage_metadata |
struct | Door het systeem verstrekte metagegevens over het gebruik, inclusief id's voor rekenresources en taken (indien van toepassing). Zie Metagegevens van gebruik. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struct | Door het systeem verstrekte metagegevens over de identiteiten die betrokken zijn bij het gebruik. Zie identiteitsmetagegevens. | Raadpleeg Identiteitsmetagegevens |
record_type |
tekenreeks | Of het record origineel, een intrekking of een herformulering is. De waarde is ORIGINAL tenzij de record is gerelateerd aan een correctie. Zie Recordtype. |
ORIGINAL |
ingestion_date |
datum | Datum waarop de record is opgenomen in de usage tabel |
2024-01-01 |
billing_origin_product |
tekenreeks | Het product dat het gebruik heeft geïnitieerd. Sommige producten kunnen worden gefactureerd als verschillende SKU's. Zie Productvoor mogelijke waarden. | JOBS |
product_features |
Struct | Details over de specifieke productfuncties die worden gebruikt. Zie Producteigenschappen. | Zie Producteigenschappen |
usage_type |
tekenreeks | Het type gebruik dat is toegewezen aan het product of de workload voor factureringsdoeleinden. Mogelijke waarden zijn COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , NETWORK_HOUR , API_OPERATION , TOKEN of GPU_TIME . |
STORAGE_SPACE |
Referentie voor gebruiksmetadata
De waarden in usage_metadata
vertellen u over de objecten en resources die betrokken zijn bij de gebruiksregistratie.
Waarde | Gegevenstype | Beschrijving |
---|---|---|
cluster_id |
tekenreeks | ID van het cluster dat is gekoppeld aan de gebruiksregistratie |
warehouse_id |
tekenreeks | Id van het SQL-warehouse dat is gekoppeld aan de gebruiksrecord |
instance_pool_id |
tekenreeks | ID van de instancepool die is gekoppeld aan de gebruiksregistratie |
node_type |
tekenreeks | Het exemplaartype van de rekenresource |
job_id |
tekenreeks | Id van de taak die is gekoppeld aan de gebruiksrecord.
Retourneert alleen een waarde voor het rekengebruik van serverloze berekeningen of taken, anders wordt geretourneerd null . |
job_run_id |
tekenreeks | Id van de taakuitvoering die is gekoppeld aan de gebruiksrecord.
Geeft alleen een waarde terug voor serverloze compute of jobs compute-gebruik, anders wordt null geretourneerd. |
job_name |
tekenreeks | Door de gebruiker opgegeven naam van de taak die is gekoppeld aan de gebruiksrecord.
Retourneert alleen een waarde voor taken die worden uitgevoerd op serverloze berekeningen, anders wordt geretourneerd null . |
notebook_id |
tekenreeks | ID van het notitieblok dat is gekoppeld aan het gebruik ervan.
Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert null . |
notebook_path |
tekenreeks | Werkruimteopslagpad van het notebook dat is gekoppeld aan het gebruik.
Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert null . |
dlt_pipeline_id |
tekenreeks | ID van de DLT-pijplijn die is gekoppeld aan de gebruiksgegevens |
dlt_update_id |
tekenreeks | Id van de DLT-pijplijnupdate die is gekoppeld aan de gebruiksrecord |
dlt_maintenance_id |
tekenreeks | ID van de onderhoudstaken voor DLT-pijplijnen die zijn gekoppeld aan het gebruiksrecord |
run_name |
tekenreeks | Unieke gebruikersgerichte identificatie van de Foundation Model Fine-tuning die is geassocieerd met de gebruiksrecord. |
endpoint_name |
tekenreeks | De naam van het model-serveer-eindpunt of vectorzoek-eindpunt dat is gekoppeld aan de gebruikersrecord |
endpoint_id |
tekenreeks | Id van het model dat eindpunt of vectorzoekeindpunt bedient dat is gekoppeld aan de gebruiksrecord |
central_clean_room_id |
tekenreeks | ID van de centrale clean room die is gekoppeld aan de gebruiksregistratie |
source_region |
string | Regio van de werkruimte die is gekoppeld aan het gebruik. Retourneert alleen een waarde voor netwerkgerelateerde kosten. |
destination_region |
tekenreeks | Regio van de bron die wordt benaderd. Retourneert alleen een waarde voor netwerkgerelateerde kosten. |
metastore_id |
tekenreeks | ID (identificatie) van de metastore die is gekoppeld aan de gebruiksregistratie |
app_id |
tekenreeks | Id van de app die is gekoppeld aan de gebruiksrecord |
app_name |
tekenreeks | Door de gebruiker opgegeven naam van de app die is gekoppeld aan de gebruiksrecord |
private_endpoint_name |
tekenreeks | Naam van het toepasselijke privé-eindpunt. Retourneert alleen een waarde voor netwerkgerelateerde kosten. |
naslaginformatie voor metagegevens van identiteit
De kolom identity_metadata
bevat meer informatie over de identiteiten die betrokken zijn bij het gebruik. Het run_as
veld logt wie de workload heeft uitgevoerd. Het veld owned_by
is alleen van toepassing op het gebruik van SQL Warehouse en registreert de gebruiker of service-principal die eigenaar is van het SQL-magazijn dat verantwoordelijk is voor het gebruik.
Daarnaast logt het aan Databricks Apps toegeschreven gebruik een waarde in het veld identity_metadata.created_by
. Deze waarde wordt gevuld met het e-mailadres van de gebruiker die de app heeft gemaakt.
identiteiten run_as
De in identity_metadata.run_as
vastgelegde identiteit is afhankelijk van het product dat aan het gebruik is gekoppeld. Raadpleeg de volgende tabel voor het identity_metadata.run_as
gedrag:
Workload type | Identiteit van run_as |
---|---|
Taakverwerking | De gebruiker of service-principal die in de run_as instelling is gedefinieerd. Taken worden standaard uitgevoerd als de persoon van de taakeigenaar, maar beheerders kunnen dit wijzigen naar een andere gebruiker of service-principal. |
Serverloze rekenkracht voor taken | De in de run_as instelling gedefinieerde gebruiker of service-principal. Standaard worden taken uitgevoerd onder de identiteit van de taakeigenaar, maar beheerders kunnen dit wijzigen naar een andere gebruiker of service-principal. |
Serverloze rekenkracht voor notebooks | De gebruiker die de notebookopdrachten heeft uitgevoerd (met name de gebruiker die de notebooksessie heeft gemaakt). Voor gedeelde notitieblokken omvat dit gebruik door andere gebruikers die dezelfde sessie delen. |
DLT-pijplijnen | De gebruiker van wie de machtigingen worden gebruikt om de DLT-pijplijn uit te voeren. Dit kan worden gewijzigd door het eigendom van de pijplijn over te dragen. |
Fijnstelling van het Fundamentele Model | De gebruiker of service-principal die de trainingsuitvoering heeft geïnitieerd. |
Voorspellende optimalisatie | De service-principal die eigendom is van Databricks en voorspellende optimalisatiebewerkingen uitvoert. |
Lakehouse-bewaking | De gebruiker die de monitor heeft gemaakt. |
verwijzing naar recordtype
De billing.usage
tabel ondersteunt correcties. Correcties treden op wanneer een veld van de gebruiksrecord onjuist is en moet worden opgelost.
Wanneer er een correctie plaatsvindt, voegt Azure Databricks twee nieuwe records toe aan de tabel. Een intrekkingsvermelding annuleert de oorspronkelijke onjuiste vermelding, waarna een herziening de gecorrigeerde informatie bevat. Correctierecords worden geïdentificeerd met behulp van het record_type
veld:
-
RETRACTION
: Wordt gebruikt om het oorspronkelijke onjuiste gebruik te vernieten. Alle velden zijn identiek aan deORIGINAL
record, behalveusage_quantity
een negatieve waarde die de oorspronkelijke gebruikshoeveelheid annuleert. Als de gebruikshoeveelheid van de oorspronkelijke record bijvoorbeeld was259.4356
, zou de intrekkingsrecord een gebruikshoeveelheid van-259.4356
hebben. -
RESTATEMENT
: De record met de juiste velden en gebruikshoeveelheid.
De volgende query retourneert bijvoorbeeld de juiste hoeveelheid per uur met betrekking tot een job_id
, zelfs als er correcties zijn aangebracht. Door de gebruikshoeveelheid te aggregeren, wordt het oorspronkelijke record door de correctieregistratie ongedaan gemaakt en worden alleen de waarden van de herformulering geretourneerd.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Notitie
Voor correcties waarbij de oorspronkelijke gebruiksrecord niet mag zijn geschreven, kan een correctie alleen een intrekkingsrecord en geen aanpassingsrecord toevoegen.
productreferentie voor factureringsoorsprong
Sommige Databricks-producten worden gefactureerd onder dezelfde gedeelde SKU. Om u te helpen onderscheid te maken tussen het gebruik, bieden de kolommen billing_origin_product
en product_features
meer inzicht in het specifieke product en de specifieke functies die aan het gebruik zijn gekoppeld.
In de kolom billing_origin_product
ziet u het Databricks-product dat is gekoppeld aan de gebruiksrecord. De waarden zijn onder andere:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
-
NETWORKING
: kosten die zijn gekoppeld aan het verbinden van serverloze rekenkracht met uw resources via privé-eindpunten. VoorNETWORKING
gebruik isworkspace_id
null
,usage_unit
ishour
ennetworking.connectivity_type
PRIVATE_IP
. -
APPS
: kosten voor het bouwen en uitvoeren van Databricks-apps
Overzicht van productkenmerken
De kolom product_features
is een object met informatie over de specifieke productfuncties die worden gebruikt en bevat de volgende sleutel-/waardeparen:
-
jobs_tier
: waarden zijn onder andereLIGHT
,CLASSIC
ofnull
-
sql_tier
: waarden zijn onder andereCLASSIC
,PRO
ofnull
-
dlt_tier
: waarden zijn onder andereCORE
,PRO
,ADVANCED
ofnull
-
is_serverless
: waarden zijntrue
offalse
ofnull
-
is_photon
: waarden zijntrue
offalse
ofnull
-
serving_type
: waarden zijn onder andereMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
ofnull
-
networking.connectivity_type
: waarden zijn onder anderePUBLIC_IP
enPRIVATE_IP