청구 가능한 사용량 시스템 테이블 참조
이 문서에서는 스키마 및 예제 쿼리를 포함하여 청구 가능한 사용 시스템 테이블에 대한 개요를 제공합니다. 시스템 테이블을 사용하면 계정의 청구 가능 사용량 데이터가 중앙 집중화되고 모든 지역으로 라우팅되므로 작업 영역이 있는 지역에서 계정의 전역 사용량을 볼 수 있습니다.
이 테이블을 사용하여 비용 및 샘플 쿼리를 모니터링하는 방법에 대한 자세한 내용은 시스템 테이블을 사용하여 비용 모니터링을 참조하세요.
테이블 경로: 이 시스템 테이블은 system.billing.usage
에 위치해 있습니다.
청구 가능한 사용 테이블 스키마
청구 가능한 사용 시스템 테이블은 다음 스키마를 사용합니다.
열 이름 | 데이터 형식 | 설명 | 예시 |
---|---|---|---|
record_id |
문자열 | 이 사용 레코드의 고유 ID | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
string | 이 보고서가 생성된 계정의 ID입니다. | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
string | 이 사용이 연결된 작업 영역의 ID | 1234567890123456 |
sku_name |
줄 | SKU의 이름 | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
문자열 | 이 사용과 관련된 클라우드입니다. 가능한 값은 AWS , AZURE 및 GCP . |
AWS , AZURE 또는 GCP |
usage_start_time |
시간표시 | 이 사용량 레코드와 관련된 시작 시간입니다. 표준 시간대 정보는 UTC 표준 시간대를 나타내는 +00:00 사용하여 값의 끝에 기록됩니다. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
타임스탬프 | 이 사용량 레코드와 관련된 종료 시간입니다. 표준 시간대 정보는 UTC 표준 시간대를 나타내는 +00:00 사용하여 값의 끝에 기록됩니다. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
날짜 | 사용 레코드의 날짜입니다. 이 필드는 날짜별 더 빠른 집계에 사용할 수 있습니다. | 2023-01-01 |
custom_tags |
지도 | 사용 레코드와 연결된 사용자 지정 태그 | { “env”: “production” } |
usage_unit |
string | 사용량이 측정되는 단위 | DBU |
usage_quantity |
소수 | 이 레코드에 사용된 단위 수 | 259.2958 |
usage_metadata |
구조체 | 컴퓨팅 리소스 및 작업에 대한 ID를 포함하여 사용량에 대한 시스템 제공 메타데이터(해당하는 경우). 사용량 메타데이터참조하세요. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
구조체 | 사용과 관련된 ID에 대한 시스템 제공 메타데이터입니다. 식별 메타데이터을 참조하세요. | ID 메타데이터 참조 |
record_type |
string | 레코드가 원본인지, 철회인지, 또는 재진술인지 여부입니다. 값은 ORIGINAL 레코드가 수정과 관련되어 있지 않은 경우입니다.
레코드 유형참조하세요. |
ORIGINAL |
ingestion_date |
날짜 | 레코드가 usage 테이블에 수집된 날짜 |
2024-01-01 |
billing_origin_product |
string | 사용에서 시작된 제품입니다. 일부 제품은 다른 SKU로 청구할 수 있습니다. 가능한 값은 Product참조하세요. | JOBS |
product_features |
스트럭트 | 사용되는 특정 제품 기능에 대한 세부 정보입니다. 제품 기능참조하세요. | 제품 기능 참조 |
usage_type |
string | 청구 목적으로 제품 또는 워크로드에 기인하는 사용 유형입니다. 가능한 값은 COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , NETWORK_HOUR , API_OPERATION , TOKEN 또는 GPU_TIME . |
STORAGE_SPACE |
메타데이터 사용 참조
usage_metadata
값은 사용 레코드와 관련된 개체 및 리소스에 대해 알려줍니다.
값 | 데이터 형식 | 설명 |
---|---|---|
cluster_id |
string | 사용 레코드와 연결된 클러스터의 ID |
warehouse_id |
문자열 | 사용 레코드와 연결된 SQL 웨어하우스의 ID |
instance_pool_id |
문자열 | 사용 레코드와 연결된 인스턴스 풀의 ID |
node_type |
문자열 | 컴퓨팅 리소스의 인스턴스 유형 |
job_id |
string | 사용 레코드와 연결된 작업의 ID입니다.
서버리스 컴퓨팅 또는 작업 컴퓨팅 사용량에 대한 값만 반환하며, 그렇지 않으면 null 를 반환합니다. |
job_run_id |
string | 사용 레코드와 연결된 작업 실행의 ID입니다.
서버리스 컴퓨팅 또는 작업 컴퓨팅 사용량에 대해서만 값을 반환하고, 그렇지 않으면 null 가 반환됩니다. |
job_name |
string | 사용 레코드와 연결된 작업의 사용자 지정 이름입니다.
서버리스 컴퓨팅에서 실행되는 작업에 대한 값만 반환하고, 그렇지 않으면 null 를 반환합니다. |
notebook_id |
string | 사용과 연결된 Notebook의 ID입니다.
노트북 사용 시 서버리스 컴퓨팅에 대해서만 값을 반환하며, 그렇지 않으면 null 를 반환합니다. |
notebook_path |
문자열 | 사용량과 연결된 Notebook의 작업 영역 스토리지 경로입니다.
Notebook 사용에 대해 서버리스 컴퓨팅에 대한 값만 반환하며, 그렇지 않은 경우에는 null 을(를) 반환합니다. |
dlt_pipeline_id |
문자열 | 사용 레코드와 연결된 DLT 파이프라인의 ID |
dlt_update_id |
문자열 | 사용 레코드와 연결된 DLT 파이프라인 업데이트의 ID |
dlt_maintenance_id |
string | 사용 레코드와 연결된 DLT 파이프라인 유지 관리 작업의 ID |
run_name |
string | 사용 기록과 연결된 Foundation Model 미세 조정의 고유한 사용자 측 식별자 |
endpoint_name |
string | 사용 레코드와 연결된 엔드포인트 또는 벡터 검색 엔드포인트를 제공하는 모델의 이름입니다. |
endpoint_id |
문자열 | 사용 레코드와 연결된 엔드포인트 또는 벡터 검색 엔드포인트를 제공하는 모델의 ID |
central_clean_room_id |
문자열 | 사용 레코드와 연결된 중앙 정리실의 ID |
source_region |
문자열 | 사용량과 연결된 작업 영역의 지역입니다. 네트워킹 관련 비용에 대한 값만 반환합니다. |
destination_region |
문자열 | 액세스 중인 리소스의 지역입니다. 네트워킹 관련 비용에 대한 값만 반환합니다. |
metastore_id |
string | 사용 레코드와 연결된 메타스토어의 ID |
app_id |
string | 사용 레코드와 연결된 앱의 ID |
app_name |
문자열 | 사용 레코드와 연결된 앱의 사용자 지정 이름 |
private_endpoint_name |
string | 적용 가능한 프라이빗 엔드포인트의 이름입니다. 네트워킹 관련 비용에 대한 값만 반환합니다. |
아이덴티티 메타데이터 참조
identity_metadata
열은 사용과 관련된 ID에 대한 자세한 정보를 제공합니다.
run_as
필드는 누가 워크로드를 실행했는지를 기록합니다.
owned_by
필드는 SQL 웨어하우스 사용량에만 적용되며 사용량을 담당하는 SQL 웨어하우스를 소유한 사용자 또는 서비스 주체를 기록합니다.
또한 'Databricks Apps'에 기인하는 사용량은 identity_metadata.created_by
필드에 값을 기록합니다. 이 값은 앱을 만든 사용자의 전자 메일로 채워집니다.
run_as ID들
기록된 identity_metadata.run_as
ID는 사용량과 연결된 제품에 따라 달라집니다.
identity_metadata.run_as
의 행동에 대해서는 다음 표를 참조하시기 바랍니다.
워크로드 유형 |
run_as 의 정체성 |
---|---|
작업 계산 | 설정에 정의된 사용자 또는 서비스 주체입니다 run_as . 기본적으로 작업은 작업 소유자의 ID로 실행되지만 관리자는 이를 다른 사용자 또는 서비스 주체로 변경할 수 있습니다. |
작업용 서버리스 컴퓨팅 | 설정에 정의된 사용자 또는 서비스 주체입니다 run_as . 기본적으로 작업은 작업 소유자의 ID로 실행되지만 관리자는 이를 다른 사용자 또는 서비스 주체로 변경할 수 있습니다. |
Notebooks에 대한 서버리스 컴퓨팅 | Notebook 명령을 실행한 사용자(특히 Notebook 세션을 만든 사용자)입니다. 공유 전자 필기장의 경우 동일한 전자 필기장 세션을 공유하는 다른 사용자의 사용량이 포함됩니다. |
DLT 파이프라인 | DLT 파이프라인을 실행하는 데 사용 권한이 있는 사용자입니다. 파이프라인의 소유권을 전송하여 변경할 수 있습니다. |
파운데이션 모델 미세 조정 | 미세 조정 학습 실행을 시작한 사용자 또는 서비스 주체입니다. |
예측 최적화 | 예측 최적화 작업을 실행하는 Databricks 소유 서비스 주체입니다. |
레이크하우스 모니터링 | 모니터를 만든 사용자입니다. |
레코드 형식 참조
billing.usage
표는 수정을 지원합니다. 사용 레코드의 필드가 올바르지 않으며 수정해야 하는 경우 수정이 수행됩니다.
수정이 발생하면 Azure Databricks는 테이블에 두 개의 새 레코드를 추가합니다. 철회 레코드는 원래 잘못된 레코드를 부정하고, 재정리 레코드에는 수정된 정보가 포함됩니다. 수정 레코드는 다음 필드를 사용하여 record_type
식별됩니다.
-
RETRACTION
: 원래 잘못된 사용을 부정하는 데 사용됩니다. 모든 필드는ORIGINAL
레코드와 동일하지만,usage_quantity
은 원래 사용량을 상쇄하는 음수 값입니다. 예를 들어, 원래 레코드의 사용량 수량이259.4356
이었다면, 취소 레코드의 사용량 수량은-259.4356
이 됩니다. -
RESTATEMENT
: 올바른 필드 및 사용량을 포함하는 레코드입니다.
예를 들어 다음 쿼리는 수정이 수행된 경우에도 A와 job_id
관련된 올바른 시간당 사용량을 반환합니다. 사용량을 집계하면, 취소 레코드는 원래 레코드를 무효화하고 다시 작성된 값만 반환됩니다.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
참고
원래 사용 레코드를 작성하지 않아야 하는 수정의 경우 수정은 취소 레코드만 추가하고 다시 실행 레코드는 추가할 수 없습니다.
청구 원산지 제품 참조
일부 Databricks 제품은 동일한 공유 SKU로 청구됩니다. 사용 현황을 구분하기 위해 billing_origin_product
및 product_features
열은 사용량과 관련된 특정 제품 및 기능에 대한 더 많은 인사이트를 제공합니다.
billing_origin_product
열에는 사용 레코드와 연결된 Databricks 제품이 표시됩니다. 값은 다음과 같습니다.
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
-
NETWORKING
: 프라이빗 엔드포인트를 통해 서버리스 컴퓨팅을 리소스에 연결하는 것과 관련된 비용입니다.NETWORKING
사용의 경우workspace_id
null
,usage_unit
hour
networking.connectivity_type
PRIVATE_IP
. -
APPS
: Databricks 앱 빌드 및 실행과 관련된 비용
제품 기능 참조
product_features
열은 사용되는 특정 제품 기능에 대한 정보를 포함하는 개체이며 다음 키/값 쌍을 포함합니다.
-
jobs_tier
: 값에는LIGHT
,CLASSIC
또는null
포함 -
sql_tier
: 값에는CLASSIC
,PRO
또는null
포함 -
dlt_tier
: 값에는CORE
,PRO
,ADVANCED
또는null
포함 -
is_serverless
: 값에는true
또는false
또는null
포함 -
is_photon
: 값에는true
또는false
또는null
포함 -
serving_type
: 값에는MODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
또는null
포함
-
networking.connectivity_type
: 값에는PUBLIC_IP
및PRIVATE_IP
포함