Bagikan melalui


Referensi tabel sistem penagihan penggunaan

Artikel ini memberikan gambaran umum tentang tabel sistem penggunaan yang dapat ditagih, termasuk skema serta contoh kueri. Dengan tabel sistem, data penggunaan akun Anda yang dapat ditagih dipusatkan dan dirutekan ke semua wilayah, sehingga Anda dapat melihat penggunaan global akun Anda dari wilayah mana pun ruang kerja Anda berada.

Untuk informasi tentang menggunakan tabel ini untuk memantau biaya dan kueri sampel, lihat Memantau biaya menggunakan tabel sistem.

Jalur tabel: Tabel sistem ini terletak di system.billing.usage.

Skema tabel penggunaan yang dapat dikenakan biaya

Tabel sistem penggunaan yang dapat ditagih menggunakan skema berikut:

Nama kolom Jenis data Deskripsi Contoh
record_id string ID unik untuk catatan penggunaan ini 11e22ba4-87b9-4cc2-9770-d10b894b7118
account_id string ID akun yang dibuat untuk laporan ini 23e22ba4-87b9-4cc2-9770-d10b894b7118
workspace_id string ID ruang kerja yang terkait dengan penggunaan ini 1234567890123456
sku_name string Nama SKU STANDARD_ALL_PURPOSE_COMPUTE
cloud string Cloud yang terkait dengan penggunaan ini. Nilai yang mungkin adalah AWS, AZURE, dan GCP. AWS, AZURE, atau GCP
usage_start_time cap waktu Waktu mulai yang relevan dengan catatan penggunaan ini. Informasi zona waktu dicatat di akhir nilai dengan +00:00 mewakili zona waktu UTC. 2023-01-09 10:00:00.000+00:00
usage_end_time cap waktu Waktu akhir yang relevan dengan catatan penggunaan ini. Informasi zona waktu dicatat di akhir nilai dengan +00:00 mewakili zona waktu UTC. 2023-01-09 11:00:00.000+00:00
usage_date tanggal Tanggal rekaman penggunaan, bidang ini dapat digunakan untuk agregasi yang lebih cepat berdasarkan tanggal 2023-01-01
custom_tags peta Tag kustom yang terkait dengan rekaman penggunaan { “env”: “production” }
usage_unit string Satuan yang digunakan untuk mengukur penggunaan ini DBU
usage_quantity desimal Jumlah unit yang digunakan untuk rekaman ini 259.2958
usage_metadata struktur Metadata yang disediakan sistem tentang penggunaan, termasuk ID untuk sumber daya komputasi dan pekerjaan (jika berlaku). Lihat Metadata Penggunaan. {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}
identity_metadata struktur Metadata yang disediakan sistem tentang identitas yang terlibat dalam penggunaan. Lihat Metadata Identitas. Lihat metadata identitas
record_type string Apakah rekaman asli, pencabutan, atau penyajian ulang. Nilainya adalah ORIGINAL, kecuali jika rekaman tersebut berkaitan dengan koreksi. Lihat Jenis Catatan. ORIGINAL
ingestion_date tanggal Tanggal rekaman diserap ke dalam tabel usage 2024-01-01
billing_origin_product string Produk yang menjadi asal mula penggunaan. Beberapa produk dapat ditagih sebagai SKU yang berbeda. Untuk nilai yang mungkin, lihat Produk . JOBS
product_features struktur Detail tentang fitur produk tertentu yang digunakan. Lihat fitur produk . Lihat Fitur Produk
usage_type rangkaian karakter Jenis penggunaan yang dikaitkan dengan produk atau beban kerja untuk tujuan penagihan. Nilai yang mungkin adalah COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTES, NETWORK_HOUR, API_OPERATION, TOKEN, atau GPU_TIME. STORAGE_SPACE

Referensi Metadata Penggunaan

Nilai dalam usage_metadata memberi tahu Anda tentang objek dan sumber daya yang terlibat dalam catatan penggunaan.

Nilai Jenis data Deskripsi
cluster_id string ID kluster yang terkait dengan rekaman penggunaan
warehouse_id string ID gudang SQL yang terkait dengan catatan penggunaan
instance_pool_id string ID kumpulan instans yang terkait dengan catatan penggunaan
node_type string Jenis instans sumber daya komputasi
job_id string ID pekerjaan yang terkait dengan catatan penggunaan. Hanya mengembalikan nilai untuk komputasi tanpa server atau penggunaan komputasi pekerjaan, jika tidak, mengembalikan null.
job_run_id string ID dari proses pekerjaan yang terkait dengan rekaman penggunaan. Hanya mengembalikan nilai untuk komputasi tanpa server atau penggunaan komputasi pekerjaan, jika tidak, mengembalikan null.
job_name string Nama yang diberikan pengguna dari pekerjaan yang terkait dengan catatan penggunaan. Hanya mengembalikan nilai untuk pekerjaan yang dijalankan pada komputasi tanpa server, jika tidak, mengembalikan null.
notebook_id string ID buku catatan yang terkait dengan penggunaan. Hanya mengembalikan nilai untuk komputasi tanpa server untuk penggunaan buku catatan, jika tidak, mengembalikan null.
notebook_path string Jalur penyimpanan ruang kerja buku catatan yang terkait dengan penggunaan. Hanya mengembalikan nilai untuk komputasi tanpa server dalam penggunaan notebook, jika tidak, mengembalikan null.
dlt_pipeline_id string ID alur DLT yang terkait dengan catatan penggunaan
dlt_update_id string ID pembaruan alur DLT yang terkait dengan catatan penggunaan
dlt_maintenance_id string ID tugas pemeliharaan alur DLT yang terkait dengan catatan penggunaan
run_name string Pengidentifikasi unik yang terlihat oleh pengguna dari penyempurnaan model dasar yang terkait dengan catatan penggunaan tersebut
endpoint_name string Nama model yang melayani titik akhir atau titik akhir pencarian vektor yang terkait dengan catatan penggunaan
endpoint_id string ID model yang melayani titik akhir atau titik akhir pencarian vektor yang terkait dengan catatan penggunaan
central_clean_room_id string ID ruang bersih pusat yang terkait dengan catatan penggunaan
source_region string Wilayah ruang kerja yang terkait dengan penggunaan. Hanya mengembalikan nilai untuk biaya terkait jaringan.
destination_region string Wilayah sumber daya yang diakses. Hanya mengembalikan nilai untuk biaya terkait jaringan.
metastore_id string ID dari metastore yang terkait dengan catatan penggunaan
app_id string ID aplikasi yang terkait dengan catatan penggunaan
app_name string Nama aplikasi yang diberikan pengguna yang terkait dengan catatan penggunaan
private_endpoint_name string Nama endpoint privat yang berlaku. Hanya mengembalikan nilai untuk biaya terkait jaringan.

referensi metadata identitas

Kolom identity_metadata menyediakan informasi selengkapnya tentang identitas yang terlibat dalam penggunaan. Bidang run_as mencatat siapa yang menjalankan beban kerja. Bidang owned_by hanya berlaku untuk penggunaan gudang SQL dan mencatat pengguna atau perwakilan layanan yang memiliki gudang SQL yang bertanggung jawab atas penggunaan.

Selain itu, penggunaan yang diatributkan ke Databricks Apps mencatat nilai di kolom identity_metadata.created_by. Nilai ini diisi dengan email pengguna yang membuat aplikasi.

identitas run_as

Identitas yang direkam dalam identity_metadata.run_as tergantung pada produk yang terkait dengan penggunaan produk tersebut. Referensikan tabel berikut untuk perilaku identity_metadata.run_as:

Tipe beban kerja Identitas run_as
Pemrosesan pekerjaan Pengguna atau prinsipal layanan yang ditentukan dalam pengaturan run_as. Secara default, pekerjaan berjalan sebagai identitas pemilik pekerjaan, tetapi admin dapat mengubahnya menjadi pengguna atau perwakilan layanan lain.
Komputasi tanpa server untuk pekerjaan Pengguna atau perwakilan layanan yang ditentukan dalam pengaturan run_as. Secara default, pekerjaan berjalan sebagai identitas pemilik pekerjaan, tetapi admin dapat mengubahnya menjadi pengguna atau perwakilan layanan lain.
Komputasi tanpa server untuk buku catatan Pengguna yang menjalankan perintah notebook (khususnya, pengguna yang membuat sesi buku catatan). Untuk buku catatan bersama, ini termasuk penggunaan oleh pengguna lain yang berbagi sesi buku catatan yang sama.
Jalur DLT Pengguna yang izinnya digunakan untuk menjalankan alur DLT. Ini dapat diubah dengan mentransfer kepemilikan pipa.
Penyempurnaan Model Dasar Pengguna atau prinsipal layanan yang memulai menjalankan pelatihan penyempurnaan.
Pengoptimalan prediktif Service principal milik Databricks yang menjalankan operasi pengoptimalan prediktif.
Pemantauan Lakehouse Pengguna yang membuat monitor.

referensi tipe rekaman

Tabel billing.usage mendukung koreksi. Koreksi terjadi ketika bidang catatan penggunaan salah dan harus diperbaiki.

Saat koreksi terjadi, Azure Databricks menambahkan dua rekaman baru ke tabel. Rekaman pencabutan meniadakan rekaman asli yang salah, lalu rekaman pemulihan menyertakan informasi yang dikoreksi. Rekaman koreksi diidentifikasi menggunakan record_type bidang :

  • RETRACTION: Digunakan untuk meniadakan penggunaan asli yang salah. Semua bidang identik dengan ORIGINAL catatan kecuali usage_quantity, yang merupakan nilai negatif yang membatalkan kuantitas penggunaan asli. Misalnya, jika kuantitas penggunaan rekaman asli adalah 259.4356, maka rekaman pencabutan akan memiliki kuantitas penggunaan -259.4356.
  • RESTATEMENT: Catatan yang mencakup bidang dan kuantitas penggunaan yang sesuai.

Misalnya, kueri berikut mengembalikan kuantitas penggunaan per jam yang benar terkait dengan job_id, meskipun telah dilakukan koreksi. Dengan menggabungkan kuantitas penggunaan, catatan penarikan meniadakan catatan asli dan hanya nilai pernyataan ulang yang dikembalikan.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Catatan

Untuk koreksi di mana catatan penggunaan asli seharusnya tidak ditulis, koreksi hanya dapat menambahkan rekaman pencabutan dan tidak ada catatan pemulihan.

referensi produk dari asal penagihan

Beberapa produk Databricks ditagih di bawah SKU bersama yang sama. Untuk membantu Anda membedakan penggunaan, kolom billing_origin_product dan product_features memberikan lebih banyak wawasan tentang produk dan fitur tertentu yang terkait dengan penggunaan.

Kolom billing_origin_product memperlihatkan produk Databricks yang terkait dengan catatan penggunaan. Nilainya meliputi:

  • JOBS
  • DLT
  • SQL
  • ALL_PURPOSE
  • MODEL_SERVING
  • INTERACTIVE
  • DEFAULT_STORAGE
  • VECTOR_SEARCH
  • LAKEHOUSE_MONITORING
  • PREDICTIVE_OPTIMIZATION
  • ONLINE_TABLES
  • FOUNDATION_MODEL_TRAINING
  • AGENT_EVALUATION
  • FINE_GRAIN_ACCESS_CONTROL
  • NETWORKING: Biaya yang terkait dengan menghubungkan komputasi tanpa server ke sumber daya Anda melalui titik akhir privat. Untuk penggunaan NETWORKING, workspace_idnull, usage_unithour, dan networking.connectivity_typePRIVATE_IP.
  • APPS: Biaya yang terkait dengan membangun dan menjalankan Databricks Apps

referensi fitur produk

Kolom product_features adalah objek yang berisi informasi tentang fitur produk tertentu yang digunakan dan menyertakan pasangan kunci/nilai berikut:

  • jobs_tier: nilai termasuk LIGHT, CLASSIC, atau null
  • sql_tier: nilai termasuk CLASSIC, PRO, atau null
  • dlt_tier: nilai termasuk CORE, PRO, ADVANCED, atau null
  • is_serverless: nilai termasuk true atau false, atau null
  • is_photon: nilai termasuk true atau false, atau null
  • serving_type: nilai termasuk MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATURE, atau null
  • networking.connectivity_type: nilai termasuk PUBLIC_IP dan PRIVATE_IP