청구 가능한 사용량 시스템 테이블 참조

아티클
03/05/2025

이 문서에서는 스키마 및 예제 쿼리를 포함하여 청구 가능한 사용 시스템 테이블에 대한 개요를 제공합니다. 시스템 테이블을 사용하면 계정의 청구 가능 사용량 데이터가 중앙 집중화되고 모든 지역으로 라우팅되므로 작업 영역이 있는 지역에서 계정의 전역 사용량을 볼 수 있습니다.

이 테이블을 사용하여 비용 및 샘플 쿼리를 모니터링하는 방법에 대한 자세한 내용은 시스템 테이블을 사용하여 비용 모니터링을 참조하세요.

테이블 경로: 이 시스템 테이블은 system.billing.usage에 위치해 있습니다.

청구 가능한 사용 테이블 스키마

청구 가능한 사용 시스템 테이블은 다음 스키마를 사용합니다.

열 이름	데이터 형식	설명	예시
`record_id`	문자열	이 사용 레코드의 고유 ID	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	string	이 보고서가 생성된 계정의 ID입니다.	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	string	이 사용이 연결된 작업 영역의 ID	`1234567890123456`
`sku_name`	줄	SKU의 이름	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	문자열	이 사용과 관련된 클라우드입니다. 가능한 값은 `AWS`, `AZURE`및 `GCP`.	`AWS`, `AZURE` 또는 `GCP`
`usage_start_time`	시간표시	이 사용량 레코드와 관련된 시작 시간입니다. 표준 시간대 정보는 UTC 표준 시간대를 나타내는 `+00:00` 사용하여 값의 끝에 기록됩니다.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	타임스탬프	이 사용량 레코드와 관련된 종료 시간입니다. 표준 시간대 정보는 UTC 표준 시간대를 나타내는 `+00:00` 사용하여 값의 끝에 기록됩니다.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	날짜	사용 레코드의 날짜입니다. 이 필드는 날짜별 더 빠른 집계에 사용할 수 있습니다.	`2023-01-01`
`custom_tags`	지도	사용 레코드와 연결된 사용자 지정 태그	`{ “env”: “production” }`
`usage_unit`	string	사용량이 측정되는 단위	`DBU`
`usage_quantity`	소수	이 레코드에 사용된 단위 수	`259.2958`
`usage_metadata`	구조체	컴퓨팅 리소스 및 작업에 대한 ID를 포함하여 사용량에 대한 시스템 제공 메타데이터(해당하는 경우). 사용량 메타데이터참조하세요.	`{cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}`
`identity_metadata`	구조체	사용과 관련된 ID에 대한 시스템 제공 메타데이터입니다. 식별 메타데이터을 참조하세요.	ID 메타데이터 참조
`record_type`	string	레코드가 원본인지, 철회인지, 또는 재진술인지 여부입니다. 값은 `ORIGINAL` 레코드가 수정과 관련되어 있지 않은 경우입니다. 레코드 유형참조하세요.	`ORIGINAL`
`ingestion_date`	날짜	레코드가 `usage` 테이블에 수집된 날짜	`2024-01-01`
`billing_origin_product`	string	사용에서 시작된 제품입니다. 일부 제품은 다른 SKU로 청구할 수 있습니다. 가능한 값은 Product참조하세요.	`JOBS`
`product_features`	스트럭트	사용되는 특정 제품 기능에 대한 세부 정보입니다. 제품 기능참조하세요.	제품 기능 참조
`usage_type`	string	청구 목적으로 제품 또는 워크로드에 기인하는 사용 유형입니다. 가능한 값은 `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTES`, `NETWORK_HOUR`, `API_OPERATION`, `TOKEN`또는 `GPU_TIME`.	`STORAGE_SPACE`

메타데이터 사용 참조

usage_metadata 값은 사용 레코드와 관련된 개체 및 리소스에 대해 알려줍니다.

값	데이터 형식	설명
`cluster_id`	string	사용 레코드와 연결된 클러스터의 ID
`warehouse_id`	문자열	사용 레코드와 연결된 SQL 웨어하우스의 ID
`instance_pool_id`	문자열	사용 레코드와 연결된 인스턴스 풀의 ID
`node_type`	문자열	컴퓨팅 리소스의 인스턴스 유형
`job_id`	string	사용 레코드와 연결된 작업의 ID입니다. 서버리스 컴퓨팅 또는 작업 컴퓨팅 사용량에 대한 값만 반환하며, 그렇지 않으면 `null`를 반환합니다.
`job_run_id`	string	사용 레코드와 연결된 작업 실행의 ID입니다. 서버리스 컴퓨팅 또는 작업 컴퓨팅 사용량에 대해서만 값을 반환하고, 그렇지 않으면 `null`가 반환됩니다.
`job_name`	string	사용 레코드와 연결된 작업의 사용자 지정 이름입니다. 서버리스 컴퓨팅에서 실행되는 작업에 대한 값만 반환하고, 그렇지 않으면 `null`를 반환합니다.
`notebook_id`	string	사용과 연결된 Notebook의 ID입니다. 노트북 사용 시 서버리스 컴퓨팅에 대해서만 값을 반환하며, 그렇지 않으면 `null`를 반환합니다.
`notebook_path`	문자열	사용량과 연결된 Notebook의 작업 영역 스토리지 경로입니다. Notebook 사용에 대해 서버리스 컴퓨팅에 대한 값만 반환하며, 그렇지 않은 경우에는 `null`을(를) 반환합니다.
`dlt_pipeline_id`	문자열	사용 레코드와 연결된 DLT 파이프라인의 ID
`dlt_update_id`	문자열	사용 레코드와 연결된 DLT 파이프라인 업데이트의 ID
`dlt_maintenance_id`	string	사용 레코드와 연결된 DLT 파이프라인 유지 관리 작업의 ID
`run_name`	string	사용 기록과 연결된 Foundation Model 미세 조정의 고유한 사용자 측 식별자
`endpoint_name`	string	사용 레코드와 연결된 엔드포인트 또는 벡터 검색 엔드포인트를 제공하는 모델의 이름입니다.
`endpoint_id`	문자열	사용 레코드와 연결된 엔드포인트 또는 벡터 검색 엔드포인트를 제공하는 모델의 ID
`central_clean_room_id`	문자열	사용 레코드와 연결된 중앙 정리실의 ID
`source_region`	문자열	사용량과 연결된 작업 영역의 지역입니다. 네트워킹 관련 비용에 대한 값만 반환합니다.
`destination_region`	문자열	액세스 중인 리소스의 지역입니다. 네트워킹 관련 비용에 대한 값만 반환합니다.
`metastore_id`	string	사용 레코드와 연결된 메타스토어의 ID
`app_id`	string	사용 레코드와 연결된 앱의 ID
`app_name`	문자열	사용 레코드와 연결된 앱의 사용자 지정 이름
`private_endpoint_name`	string	적용 가능한 프라이빗 엔드포인트의 이름입니다. 네트워킹 관련 비용에 대한 값만 반환합니다.

아이덴티티 메타데이터 참조

identity_metadata 열은 사용과 관련된 ID에 대한 자세한 정보를 제공합니다. run_as 필드는 누가 워크로드를 실행했는지를 기록합니다. owned_by 필드는 SQL 웨어하우스 사용량에만 적용되며 사용량을 담당하는 SQL 웨어하우스를 소유한 사용자 또는 서비스 주체를 기록합니다.

또한 'Databricks Apps'에 기인하는 사용량은 identity_metadata.created_by 필드에 값을 기록합니다. 이 값은 앱을 만든 사용자의 전자 메일로 채워집니다.

run_as ID들

기록된 identity_metadata.run_as ID는 사용량과 연결된 제품에 따라 달라집니다. identity_metadata.run_as의 행동에 대해서는 다음 표를 참조하시기 바랍니다.

워크로드 유형	`run_as`의 정체성
작업 계산	설정에 정의된 사용자 또는 서비스 주체입니다 `run_as` . 기본적으로 작업은 작업 소유자의 ID로 실행되지만 관리자는 이를 다른 사용자 또는 서비스 주체로 변경할 수 있습니다.
작업용 서버리스 컴퓨팅	설정에 정의된 사용자 또는 서비스 주체입니다 `run_as` . 기본적으로 작업은 작업 소유자의 ID로 실행되지만 관리자는 이를 다른 사용자 또는 서비스 주체로 변경할 수 있습니다.
Notebooks에 대한 서버리스 컴퓨팅	Notebook 명령을 실행한 사용자(특히 Notebook 세션을 만든 사용자)입니다. 공유 전자 필기장의 경우 동일한 전자 필기장 세션을 공유하는 다른 사용자의 사용량이 포함됩니다.
DLT 파이프라인	DLT 파이프라인을 실행하는 데 사용 권한이 있는 사용자입니다. 파이프라인의 소유권을 전송하여 변경할 수 있습니다.
파운데이션 모델 미세 조정	미세 조정 학습 실행을 시작한 사용자 또는 서비스 주체입니다.
예측 최적화	예측 최적화 작업을 실행하는 Databricks 소유 서비스 주체입니다.
레이크하우스 모니터링	모니터를 만든 사용자입니다.

레코드 형식 참조

billing.usage 표는 수정을 지원합니다. 사용 레코드의 필드가 올바르지 않으며 수정해야 하는 경우 수정이 수행됩니다.

수정이 발생하면 Azure Databricks는 테이블에 두 개의 새 레코드를 추가합니다. 철회 레코드는 원래 잘못된 레코드를 부정하고, 재정리 레코드에는 수정된 정보가 포함됩니다. 수정 레코드는 다음 필드를 사용하여 record_type 식별됩니다.

RETRACTION: 원래 잘못된 사용을 부정하는 데 사용됩니다. 모든 필드는 ORIGINAL 레코드와 동일하지만, usage_quantity은 원래 사용량을 상쇄하는 음수 값입니다. 예를 들어, 원래 레코드의 사용량 수량이 259.4356이었다면, 취소 레코드의 사용량 수량은 -259.4356이 됩니다.
RESTATEMENT: 올바른 필드 및 사용량을 포함하는 레코드입니다.

예를 들어 다음 쿼리는 수정이 수행된 경우에도 A와 job_id관련된 올바른 시간당 사용량을 반환합니다. 사용량을 집계하면, 취소 레코드는 원래 레코드를 무효화하고 다시 작성된 값만 반환됩니다.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

참고

원래 사용 레코드를 작성하지 않아야 하는 수정의 경우 수정은 취소 레코드만 추가하고 다시 실행 레코드는 추가할 수 없습니다.

청구 원산지 제품 참조

일부 Databricks 제품은 동일한 공유 SKU로 청구됩니다. 사용 현황을 구분하기 위해 billing_origin_product 및 product_features 열은 사용량과 관련된 특정 제품 및 기능에 대한 더 많은 인사이트를 제공합니다.

billing_origin_product 열에는 사용 레코드와 연결된 Databricks 제품이 표시됩니다. 값은 다음과 같습니다.

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL

NETWORKING: 프라이빗 엔드포인트를 통해 서버리스 컴퓨팅을 리소스에 연결하는 것과 관련된 비용입니다. NETWORKING 사용의 경우 workspace_idnull, usage_unithournetworking.connectivity_typePRIVATE_IP.
APPS: Databricks 앱 빌드 및 실행과 관련된 비용

제품 기능 참조

product_features 열은 사용되는 특정 제품 기능에 대한 정보를 포함하는 개체이며 다음 키/값 쌍을 포함합니다.

jobs_tier: 값에는 LIGHT, CLASSIC또는 null 포함
sql_tier: 값에는 CLASSIC, PRO또는 null 포함
dlt_tier: 값에는 CORE, PRO, ADVANCED또는 null 포함
is_serverless: 값에는 true 또는 false또는 null 포함
is_photon: 값에는 true 또는 false또는 null 포함
serving_type: 값에는 MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATURE또는 null 포함

networking.connectivity_type: 값에는 PUBLIC_IP 및 PRIVATE_IP 포함

다음을 통해 공유