Referenční informace k tabulce systému fakturovatelného využití
Tento článek obsahuje přehled fakturovatelné tabulky systému využití, včetně schématu a ukázkových dotazů. V systémových tabulkách jsou fakturovatelná data o využití vašeho účtu centralizovaná a směrovaná do všech oblastí, takže můžete zobrazit globální využití vašeho účtu z jakékoli oblasti, ve které se váš pracovní prostor nachází.
Informace o použití této tabulky k monitorování nákladů a ukázkových dotazů naleznete v tématu Monitorování nákladů pomocí systémových tabulek.
cesta k tabulce: Tato systémová tabulka se nachází v system.billing.usage
.
Schéma tabulky fakturovatelného využití
Tabulka fakturovatelného systému využití používá následující schéma:
Název sloupce | Datový typ | Popis | Příklad |
---|---|---|---|
record_id |
řetězec | Jedinečné ID pro tento záznam o využití | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
řetězec | ID účtu, pro který byl tento report vygenerován | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
řetězec | ID pracovního prostoru, ke které bylo toto využití přidruženo | 1234567890123456 |
sku_name |
string | Název skladové položky | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
řetězec | Cloud přidružený k tomuto využití Možné hodnoty jsou AWS , AZURE a GCP . |
AWS , AZURE nebo GCP |
usage_start_time |
časové razítko | Počáteční čas, který je relevantní pro tento záznam využití. Informace o časovém pásmu se zaznamenávají na konci hodnoty s +00:00 představující časové pásmo UTC. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
časové razítko | Koncový čas, který je relevantní pro tento záznam využití. Informace o časovém pásmu se zaznamenávají na konci hodnoty s +00:00 představující časové pásmo UTC. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
datum | Datum záznamu o využití, toto pole lze použít k rychlejší agregaci podle data. | 2023-01-01 |
custom_tags |
mapa | Vlastní značky přidružené k záznamu využití | { “env”: “production” } |
usage_unit |
řetězec | Jednotka, ve které se toto využití měří | DBU |
usage_quantity |
desetinný | Počet jednotek spotřebovaných pro tento záznam | 259.2958 |
usage_metadata |
struct | Systémová metadata o využití, včetně ID výpočetních prostředků a úloh (pokud je k dispozici). Viz metadata využití. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struktura | Systémová metadata o identitách, které jsou součástí použití. Viz metadat identit. | Projděte si metadat identit |
record_type |
řetězec | Bez ohledu na to, zda je záznam původní, odvolání nebo přehodnocení. Hodnota je ORIGINAL , pokud není záznam spojen s opravou. Viz typ záznamu. |
ORIGINAL |
ingestion_date |
datum | Datum, kdy se záznam ingestoval do tabulky usage |
2024-01-01 |
billing_origin_product |
řetězec | Produkt, který začal používání. Některé produkty se můžou účtovat jako různé skladové položky. Možné hodnoty naleznete v Produkt. | JOBS |
product_features |
struktura | Podrobnosti o použitých funkcích produktu Viz funkce produktu . | Viz funkce produktu |
usage_type |
řetězec | Typ využití přiřazený k produktu nebo úloze pro účely fakturace. Možné hodnoty jsou COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , NETWORK_HOUR , API_OPERATION , TOKEN nebo GPU_TIME . |
STORAGE_SPACE |
Referenční informace o metadatech využití
Hodnoty v usage_metadata
vám řeknou o objektech a prostředcích zahrnutých v záznamu využití.
Hodnota | Datový typ | Popis |
---|---|---|
cluster_id |
řetězec | ID clusteru přidruženého k záznamu využití |
warehouse_id |
řetězec | ID SQL Warehouse přidruženého k záznamu využití |
instance_pool_id |
string | ID fondu instancí přidruženého k záznamu využití |
node_type |
řetězec | Typ instance výpočetního prostředku |
job_id |
string | ID úlohy přidružené k záznamu o využití
Vrátí hodnotu pouze pro využití serverless computingu nebo úloh, jinak vrátí null . |
job_run_id |
řetězec | ID běhu úlohy přiřazeného k záznamu využití.
Vrátí hodnotu pouze pro využití bez serverových výpočtů nebo při použití výpočetních prostředků pro úlohy, jinak vrátí null . |
job_name |
string | Uživatelské jméno úlohy přidružené k záznamu využití.
Vrátí hodnotu pouze pro úlohy spuštěné na bezserverovém výpočetním prostředí, jinak vrátí null hodnotu . |
notebook_id |
řetězec | ID poznámkového bloku spojeného s použitím
Vrátí hodnotu pouze pro bezserverové výpočty v rámci využití v poznámkovém bloku, jinak vrátí null . |
notebook_path |
string | Cesta k úložišti poznámkového bloku pracovního prostoru spojeného s použitím.
Vrátí hodnotu pouze pro bezserverové výpočetní prostředky pro využití poznámkového bloku, jinak vrátí null hodnotu . |
dlt_pipeline_id |
řetězec | ID kanálu DLT přidruženého k záznamu využití |
dlt_update_id |
řetězec | ID aktualizace kanálu DLT přidružené k záznamu využití |
dlt_maintenance_id |
řetězec | ID úloh údržby kanálu DLT přidružených k záznamu využití |
run_name |
řetězec | Jedinečný uživatelsky orientovaný identifikátor jemného dolaďování základního modelu spojený se záznamem o využití |
endpoint_name |
řetězec | Název modelu obsluhující koncový bod nebo koncový bod vektorového vyhledávání přidružený k záznamu využití |
endpoint_id |
řetězec | ID modelu obsluhující koncový bod nebo koncový bod vektorového vyhledávání přidružený k záznamu využití |
central_clean_room_id |
string | ID centrální čisté místnosti přidružené k záznamu o využití |
source_region |
string | Oblast pracovního prostoru související s využitím Vrátí hodnotu pouze pro náklady spojené se síťovými operacemi. |
destination_region |
string | Oblast zdroje, ke kterému se přistupuje. Vrátí hodnotu pouze pro náklady spojené se síťovými operacemi. |
metastore_id |
string | ID metastoru přidruženého k záznamu využití |
app_id |
řetězec | ID aplikace přidružené k záznamu využití |
app_name |
řetězec | Uživatelské jméno aplikace přidružené k záznamu využití |
private_endpoint_name |
řetězec | Název příslušného privátního koncového bodu. Vrátí hodnotu pouze pro náklady spojené se síťovými operacemi. |
Referenční informace k metadatem identit
Sloupec identity_metadata
poskytuje další informace o identitách, které jsou součástí použití. Pole run_as
protokoluje, kdo spustil úlohu. Pole owned_by
platí jenom pro využití datového skladu SQL a protokoluje uživatele nebo instanční objekt, který vlastní datový sklad SQL odpovědný za toto využití.
Kromě toho použití přiřazené aplikacím Databricks zaznamenává hodnotu v poli identity_metadata.created_by
. Tato hodnota se naplní e-mailem uživatele, který aplikaci vytvořil.
spustit jako identity
Identita zaznamenaná v identity_metadata.run_as
závisí na produktu přidruženém k použití. Informace o chování identity_metadata.run_as
najdete v následující tabulce:
Typ úlohy | Identita run_as |
---|---|
Úlohy se počítají | Uživatel nebo služební hlavní objekt definovaný v run_as nastavení. Ve výchozím nastavení se úlohy spouštějí s identitou vlastníka úlohy, ale správci mohou tuto identitu změnit na jiného uživatele nebo služební účet. |
Bezserverové výpočetní prostředky pro úlohy | Uživatel nebo principál služby definovaný v nastavení run_as . Ve výchozím nastavení se úlohy spouštějí jako identita vlastníka úlohy, ale správci ji můžou změnit na jiného uživatele nebo na přihlašovací údaj služby. |
Bezserverové výpočetní pro notebooky | Uživatel, který spustil příkazy poznámkového bloku (konkrétně uživatel, který vytvořil relaci poznámkového bloku). U sdílených poznámkových bloků to zahrnuje použití jinými uživateli, kteří sdílejí stejnou relaci poznámkového bloku. |
Kanály DLT | Uživatel, jehož oprávnění se používají ke spuštění kanálu DLT. To se dá změnit převodem vlastnictví kanálu. |
Vyladění základního modelu | Uživatel nebo servisní účet, který inicioval vyladění tréninkového spuštění. |
Prediktivní optimalizace | Instanční objekt vlastněný službou Databricks, který spouští prediktivní optimalizační operace. |
Monitorování Lakehouse | Uživatel, který vytvořil monitor. |
Reference k typu záznamu
Tabulka billing.usage
podporuje opravy. K opravám dochází, když je jakékoli pole záznamu o využití nesprávné a musí být opraveno.
Když dojde k opravě, Azure Databricks přidá do tabulky dva nové záznamy. Záznam odvolání neguje původní nesprávný záznam a potom záznam opětovného obnovení obsahuje opravené informace. Záznamy oprav se identifikují pomocí record_type
pole:
-
RETRACTION
: Slouží k negovat původní nesprávné použití. Všechna pole jsou shodná se záznamemORIGINAL
s výjimkouusage_quantity
záporné hodnoty, která zruší původní množství využití. Například pokud bylo množství využití původního záznamu259.4356
, pak by záznam odvolání měl množství využití-259.4356
. -
RESTATEMENT
: Záznam, který obsahuje správná pole a množství využití.
Například následující dotaz vrátí správné hodinové množství využití související s , job_id
i když byly provedeny opravy. Při agregaci množství využití záznam o zrušení neguje původní záznam a vrátí se pouze hodnoty opravného záznamu.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Poznámka:
Pro opravy, u kterých by původní záznam o využití neměl být zapsán, může oprava přidat pouze záznam odvolání a žádný záznam o opětovném obnovení.
referenční číslo produktu původu fakturace
Některé produkty Databricks se účtují ve stejné sdílené skladové položce. Sloupce billing_origin_product
a product_features
, které vám pomůžou odlišit využití, poskytují lepší přehled o konkrétním produktu a funkcích přidružených k využití.
Ve sloupci billing_origin_product
se zobrazuje produkt Databricks přidružený k záznamu o využití. Mezi tyto hodnoty patří:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
-
NETWORKING
: Náklady spojené s připojením bezserverového výpočetního prostředí k prostředkům prostřednictvím privátních koncových bodů. Pro použitíNETWORKING
jeworkspace_id
null
,usage_unit
jehour
, anetworking.connectivity_type
jePRIVATE_IP
. -
APPS
: Náklady spojené se sestavováním a provozem Databricks Apps
Referenční informace k funkcím produktu
Sloupec product_features
je objekt obsahující informace o použitých konkrétních funkcích produktu a obsahuje následující páry klíč/hodnota:
-
jobs_tier
: hodnoty zahrnujíLIGHT
,CLASSIC
nebonull
-
sql_tier
: hodnoty zahrnujíCLASSIC
,PRO
nebonull
-
dlt_tier
: hodnoty zahrnujíCORE
,PRO
,ADVANCED
nebonull
-
is_serverless
: hodnoty zahrnujítrue
nebofalse
nebonull
-
is_photon
: hodnoty zahrnujítrue
nebofalse
nebonull
-
serving_type
: hodnoty zahrnujíMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
nebonull
-
networking.connectivity_type
: hodnoty zahrnujíPUBLIC_IP
aPRIVATE_IP