Sdílet prostřednictvím


Referenční informace k tabulce systému fakturovatelného využití

Tento článek obsahuje přehled fakturovatelné tabulky systému využití, včetně schématu a ukázkových dotazů. V systémových tabulkách jsou fakturovatelná data o využití vašeho účtu centralizovaná a směrovaná do všech oblastí, takže můžete zobrazit globální využití vašeho účtu z jakékoli oblasti, ve které se váš pracovní prostor nachází.

Informace o použití této tabulky k monitorování nákladů a ukázkových dotazů naleznete v tématu Monitorování nákladů pomocí systémových tabulek.

cesta k tabulce: Tato systémová tabulka se nachází v system.billing.usage.

Schéma tabulky fakturovatelného využití

Tabulka fakturovatelného systému využití používá následující schéma:

Název sloupce Datový typ Popis Příklad
record_id řetězec Jedinečné ID pro tento záznam o využití 11e22ba4-87b9-4cc2-9770-d10b894b7118
account_id řetězec ID účtu, pro který byl tento report vygenerován 23e22ba4-87b9-4cc2-9770-d10b894b7118
workspace_id řetězec ID pracovního prostoru, ke které bylo toto využití přidruženo 1234567890123456
sku_name string Název skladové položky STANDARD_ALL_PURPOSE_COMPUTE
cloud řetězec Cloud přidružený k tomuto využití Možné hodnoty jsou AWS, AZUREa GCP. AWS, AZURE nebo GCP
usage_start_time časové razítko Počáteční čas, který je relevantní pro tento záznam využití. Informace o časovém pásmu se zaznamenávají na konci hodnoty s +00:00 představující časové pásmo UTC. 2023-01-09 10:00:00.000+00:00
usage_end_time časové razítko Koncový čas, který je relevantní pro tento záznam využití. Informace o časovém pásmu se zaznamenávají na konci hodnoty s +00:00 představující časové pásmo UTC. 2023-01-09 11:00:00.000+00:00
usage_date datum Datum záznamu o využití, toto pole lze použít k rychlejší agregaci podle data. 2023-01-01
custom_tags mapa Vlastní značky přidružené k záznamu využití { “env”: “production” }
usage_unit řetězec Jednotka, ve které se toto využití měří DBU
usage_quantity desetinný Počet jednotek spotřebovaných pro tento záznam 259.2958
usage_metadata struct Systémová metadata o využití, včetně ID výpočetních prostředků a úloh (pokud je k dispozici). Viz metadata využití. {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}
identity_metadata struktura Systémová metadata o identitách, které jsou součástí použití. Viz metadat identit. Projděte si metadat identit
record_type řetězec Bez ohledu na to, zda je záznam původní, odvolání nebo přehodnocení. Hodnota je ORIGINAL, pokud není záznam spojen s opravou. Viz typ záznamu. ORIGINAL
ingestion_date datum Datum, kdy se záznam ingestoval do tabulky usage 2024-01-01
billing_origin_product řetězec Produkt, který začal používání. Některé produkty se můžou účtovat jako různé skladové položky. Možné hodnoty naleznete v Produkt. JOBS
product_features struktura Podrobnosti o použitých funkcích produktu Viz funkce produktu . Viz funkce produktu
usage_type řetězec Typ využití přiřazený k produktu nebo úloze pro účely fakturace. Možné hodnoty jsou COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTES, NETWORK_HOUR, API_OPERATION, TOKENnebo GPU_TIME. STORAGE_SPACE

Referenční informace o metadatech využití

Hodnoty v usage_metadata vám řeknou o objektech a prostředcích zahrnutých v záznamu využití.

Hodnota Datový typ Popis
cluster_id řetězec ID clusteru přidruženého k záznamu využití
warehouse_id řetězec ID SQL Warehouse přidruženého k záznamu využití
instance_pool_id string ID fondu instancí přidruženého k záznamu využití
node_type řetězec Typ instance výpočetního prostředku
job_id string ID úlohy přidružené k záznamu o využití Vrátí hodnotu pouze pro využití serverless computingu nebo úloh, jinak vrátí null.
job_run_id řetězec ID běhu úlohy přiřazeného k záznamu využití. Vrátí hodnotu pouze pro využití bez serverových výpočtů nebo při použití výpočetních prostředků pro úlohy, jinak vrátí null.
job_name string Uživatelské jméno úlohy přidružené k záznamu využití. Vrátí hodnotu pouze pro úlohy spuštěné na bezserverovém výpočetním prostředí, jinak vrátí nullhodnotu .
notebook_id řetězec ID poznámkového bloku spojeného s použitím Vrátí hodnotu pouze pro bezserverové výpočty v rámci využití v poznámkovém bloku, jinak vrátí null.
notebook_path string Cesta k úložišti poznámkového bloku pracovního prostoru spojeného s použitím. Vrátí hodnotu pouze pro bezserverové výpočetní prostředky pro využití poznámkového bloku, jinak vrátí nullhodnotu .
dlt_pipeline_id řetězec ID kanálu DLT přidruženého k záznamu využití
dlt_update_id řetězec ID aktualizace kanálu DLT přidružené k záznamu využití
dlt_maintenance_id řetězec ID úloh údržby kanálu DLT přidružených k záznamu využití
run_name řetězec Jedinečný uživatelsky orientovaný identifikátor jemného dolaďování základního modelu spojený se záznamem o využití
endpoint_name řetězec Název modelu obsluhující koncový bod nebo koncový bod vektorového vyhledávání přidružený k záznamu využití
endpoint_id řetězec ID modelu obsluhující koncový bod nebo koncový bod vektorového vyhledávání přidružený k záznamu využití
central_clean_room_id string ID centrální čisté místnosti přidružené k záznamu o využití
source_region string Oblast pracovního prostoru související s využitím Vrátí hodnotu pouze pro náklady spojené se síťovými operacemi.
destination_region string Oblast zdroje, ke kterému se přistupuje. Vrátí hodnotu pouze pro náklady spojené se síťovými operacemi.
metastore_id string ID metastoru přidruženého k záznamu využití
app_id řetězec ID aplikace přidružené k záznamu využití
app_name řetězec Uživatelské jméno aplikace přidružené k záznamu využití
private_endpoint_name řetězec Název příslušného privátního koncového bodu. Vrátí hodnotu pouze pro náklady spojené se síťovými operacemi.

Referenční informace k metadatem identit

Sloupec identity_metadata poskytuje další informace o identitách, které jsou součástí použití. Pole run_as protokoluje, kdo spustil úlohu. Pole owned_by platí jenom pro využití datového skladu SQL a protokoluje uživatele nebo instanční objekt, který vlastní datový sklad SQL odpovědný za toto využití.

Kromě toho použití přiřazené aplikacím Databricks zaznamenává hodnotu v poli identity_metadata.created_by. Tato hodnota se naplní e-mailem uživatele, který aplikaci vytvořil.

spustit jako identity

Identita zaznamenaná v identity_metadata.run_as závisí na produktu přidruženém k použití. Informace o chování identity_metadata.run_as najdete v následující tabulce:

Typ úlohy Identita run_as
Úlohy se počítají Uživatel nebo služební hlavní objekt definovaný v run_as nastavení. Ve výchozím nastavení se úlohy spouštějí s identitou vlastníka úlohy, ale správci mohou tuto identitu změnit na jiného uživatele nebo služební účet.
Bezserverové výpočetní prostředky pro úlohy Uživatel nebo principál služby definovaný v nastavení run_as. Ve výchozím nastavení se úlohy spouštějí jako identita vlastníka úlohy, ale správci ji můžou změnit na jiného uživatele nebo na přihlašovací údaj služby.
Bezserverové výpočetní pro notebooky Uživatel, který spustil příkazy poznámkového bloku (konkrétně uživatel, který vytvořil relaci poznámkového bloku). U sdílených poznámkových bloků to zahrnuje použití jinými uživateli, kteří sdílejí stejnou relaci poznámkového bloku.
Kanály DLT Uživatel, jehož oprávnění se používají ke spuštění kanálu DLT. To se dá změnit převodem vlastnictví kanálu.
Vyladění základního modelu Uživatel nebo servisní účet, který inicioval vyladění tréninkového spuštění.
Prediktivní optimalizace Instanční objekt vlastněný službou Databricks, který spouští prediktivní optimalizační operace.
Monitorování Lakehouse Uživatel, který vytvořil monitor.

Reference k typu záznamu

Tabulka billing.usage podporuje opravy. K opravám dochází, když je jakékoli pole záznamu o využití nesprávné a musí být opraveno.

Když dojde k opravě, Azure Databricks přidá do tabulky dva nové záznamy. Záznam odvolání neguje původní nesprávný záznam a potom záznam opětovného obnovení obsahuje opravené informace. Záznamy oprav se identifikují pomocí record_type pole:

  • RETRACTION: Slouží k negovat původní nesprávné použití. Všechna pole jsou shodná se záznamem ORIGINAL s výjimkou usage_quantityzáporné hodnoty, která zruší původní množství využití. Například pokud bylo množství využití původního záznamu 259.4356, pak by záznam odvolání měl množství využití -259.4356.
  • RESTATEMENT: Záznam, který obsahuje správná pole a množství využití.

Například následující dotaz vrátí správné hodinové množství využití související s , job_idi když byly provedeny opravy. Při agregaci množství využití záznam o zrušení neguje původní záznam a vrátí se pouze hodnoty opravného záznamu.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Poznámka:

Pro opravy, u kterých by původní záznam o využití neměl být zapsán, může oprava přidat pouze záznam odvolání a žádný záznam o opětovném obnovení.

referenční číslo produktu původu fakturace

Některé produkty Databricks se účtují ve stejné sdílené skladové položce. Sloupce billing_origin_product a product_features, které vám pomůžou odlišit využití, poskytují lepší přehled o konkrétním produktu a funkcích přidružených k využití.

Ve sloupci billing_origin_product se zobrazuje produkt Databricks přidružený k záznamu o využití. Mezi tyto hodnoty patří:

  • JOBS
  • DLT
  • SQL
  • ALL_PURPOSE
  • MODEL_SERVING
  • INTERACTIVE
  • DEFAULT_STORAGE
  • VECTOR_SEARCH
  • LAKEHOUSE_MONITORING
  • PREDICTIVE_OPTIMIZATION
  • ONLINE_TABLES
  • FOUNDATION_MODEL_TRAINING
  • AGENT_EVALUATION
  • FINE_GRAIN_ACCESS_CONTROL
  • NETWORKING: Náklady spojené s připojením bezserverového výpočetního prostředí k prostředkům prostřednictvím privátních koncových bodů. Pro použití NETWORKING je workspace_idnull, usage_unit je hour, a networking.connectivity_type je PRIVATE_IP.
  • APPS: Náklady spojené se sestavováním a provozem Databricks Apps

Referenční informace k funkcím produktu

Sloupec product_features je objekt obsahující informace o použitých konkrétních funkcích produktu a obsahuje následující páry klíč/hodnota:

  • jobs_tier: hodnoty zahrnují LIGHT, CLASSICnebo null
  • sql_tier: hodnoty zahrnují CLASSIC, PROnebo null
  • dlt_tier: hodnoty zahrnují CORE, PRO, ADVANCEDnebo null
  • is_serverless: hodnoty zahrnují true nebo falsenebo null
  • is_photon: hodnoty zahrnují true nebo falsenebo null
  • serving_type: hodnoty zahrnují MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREnebo null
  • networking.connectivity_type: hodnoty zahrnují PUBLIC_IP a PRIVATE_IP