Aracılığıyla paylaş


Bilgisayar sistem tabloları başvuru kaynağı

Önemli

Bu sistem tablosu Genel Önizlemeiçindedir. Tabloya erişmek için şemanın system kataloğunuzda etkinleştirilmesi gerekir. Daha fazla bilgi için bkz. sistem tablosu şemalarını etkinleştirme.

Bu makalede, işlem sistemi tabloları için bir başvuru kılavuzu sağlanır. Hesabınızdaki genel amaçlı ve görev işlem etkinliği ile metriklerini izlemek için bu tabloları kullanabilirsiniz.

  • clusters: Hesabınızdaki işlem yapılandırmalarını kaydeder.
  • node_types: Donanım bilgileri de dahil olmak üzere şu anda kullanılabilir olan düğüm türlerinin her biri için tek bir kayıt içerir.
  • node_timeline: İşleminizin kullanım ölçümlerinin dakika dakika kayıtlarını içerir.

Küme tablosu şeması

Küme tablosu, çok amaçlı işlem ve iş işlemleri için zaman içindeki işlem yapılandırmalarının tam geçmişini içeren yavaş değişen bir boyut tablosudur.

Tablo yolu: Bu sistem tablosu system.compute.clusters'de yer almaktadır.

Sütun adı Veri türü Açıklama Örnek
account_id Dize Bu kümenin oluşturulduğu hesabın kimliği. 23e22ba4-87b9-
4cc2-9770-d10b894b7118
workspace_id Dize Bu kümenin oluşturulduğu çalışma alanının kimliği. 1234567890123456
cluster_id Dize Bu kaydın ilişkilendirildiği kümenin kimliği. 0000-123456-crmpt124
cluster_name Dize Küme için kullanıcı tanımlı ad. My cluster
owned_by Dize Küme sahibinin kullanıcı adı. Varsayılan olarak küme oluşturucusu kullanılır, ancak Kümeler API'sini kullanarak değiştirilebilir. sample_user@email.com
create_time timestamp Bu işlem tanımında yapılan değişikliğin zaman damgası. 2023-01-09 11:00:00.000
delete_time timestamp Silinmiş kümenin zaman damgası. Küme silinmezse değer null olur. 2023-01-09 11:00:00.000
driver_node_type Dize Sürücü düğümü türü adı. Bu, bulut sağlayıcısındaki örnek türü adıyla eşleşir. Standard_D16s_v3
worker_node_type Dize Çalışan düğümü türü adı. Bu, bulut sağlayıcısındaki örnek türü adıyla eşleşir. Standard_D16s_v3
worker_count bigint çalışan sayısı. Yalnızca sabit boyutlu kümeler için tanımlanır. 4
min_autoscale_workers bigint Ayarlanan en az çalışan sayısı. Bu alan yalnızca otomatik ölçeklendirme kümeleri için geçerlidir. 1
max_autoscale_workers bigint Ayarlanan en fazla çalışan sayısı. Bu alan yalnızca otomatik ölçeklendirme kümeleri için geçerlidir. 1
auto_termination_minutes bigint Yapılandırılan otomatik sonlandırma süresi. 120
enable_elastic_disk boolean Otomatik ölçeklendirme diski etkinleştirme durumu. true
tags harita Küme için kullanıcı tanımlı etiketler (varsayılan etiketleri içermez). {"ResourceClass":"SingleNode"}
cluster_source Dize Kümenin oluşturucusunu gösterir: UI, API, JOB, vb. UI
init_scripts dizi Başlatma komut dosyaları için init yolları kümesi. "/Users/example@email.com
/files/scripts/install-python-pacakges.sh"
aws_attributes yapı AWS'ye özgü ayarlar. null
azure_attributes yapı Azure'a özgü ayarlar. {
"first_on_demand": "0",
"availability": "ON_DEMAND_AZURE",
"spot_bid_max_price": "—1"
}
gcp_attributes yapı GCP'ye özgü ayarlar. Bu alan boş olacaktır. null
driver_instance_pool_id Dize Sürücü bir örnek havuzunun üzerinde yapılandırılmışsa örnek havuzu kimliği. 1107-555555-crhod16-pool-DIdnjazB
worker_instance_pool_id Dize Çalışan bir örnek havuzunun üzerinde yapılandırılmışsa Örnek Havuzu Kimliği. 1107-555555-crhod16-pool-DIdnjazB
dbr_version Dize Kümenin Databricks Çalışma Süresi. 14.x-snapshot-scala2.12
change_time timestamp İşlem tanımında yapılan değişikliğin zaman damgası. 2023-01-09 11:00:00.000
change_date tarih Tarihi değiştirin. Saklama için kullanılır. 2023-01-09

Düğüm türleri tablo şeması

Düğüm türü tablosu, şu anda kullanılabilir olan düğüm türlerini temel donanım bilgileriyle yakalar.

Tablo yolu: Bu sistem tablosu system.compute.node_typeskonumunda bulunur.

Sütun adı Veri türü Açıklama Örnek
account_id Dize Bu kümenin oluşturulduğu hesabın kimliği. 23e22ba4-87b9-4cc2-9770-d10b894b7118
node_type Dize Düğüm türü için benzersiz tanımlayıcı. Standard_D16s_v3
core_count iki katı Örnek için vCPU sayısı. 48.0
memory_mb uzun Örnek için toplam bellek. 393216
gpu_count uzun Örnek için GPU sayısı. 0

Düğüm zaman çizelgesi tablosu şeması

Düğüm zaman çizelgesi tablosu, düğüm düzeyinde kaynak kullanım verilerini dakika ayrıntı düzeyinde yakalar. Her kayıt, örnek başına belirli bir dakika boyunca veri içerir.

Tablo yolu: Bu sistem tablosu system.compute.node_timelinekonumunda bulunur.

Sütun adı Veri türü Açıklama Örnek
account_id Dize Bu işlem kaynağının çalıştığı hesabın kimliği. 23e22ba4-87b9-4cc2-9770-d10b894b7118
workspace_id Dize Bu işlem kaynağının çalıştığı çalışma alanının kimliği. 1234567890123456
cluster_id Dize İşlem kaynağının kimliği. 0000-123456-crmpt124
instance_id String Belirli bir örneğin tanımlayıcısı. i-1234a6c12a2681234
start_time timestamp Kayıt için başlangıç saati UTC'ye göre. 2024-07-16T12:00:00Z
end_time timestamp Utc'de kaydın bitiş saati. 2024-07-16T13:00:00Z
driver boolean Örneğin bir sürücü veya çalışan düğümü olup olmadığı. true
cpu_user_percent çift CPU'nun userland'da harcadığı sürenin yüzdesi. 34.76163817234407
cpu_system_percent çift CPU'nun çekirdekte harcadığı sürenin yüzdesi. 1.0895310279488264
cpu_wait_percent çift CPU'nun G/Ç beklerken harcadığı sürenin yüzdesi. 0.03445157400629276
mem_used_percent çift İşlemde çalışan arka plan işlemleri tarafından kullanılan bellek de dahil olmak üzere, zaman aralığında kullanılan işlem belleğinin yüzdesi. 45.34858216779041
mem_swap_percent çift Bellek değiştirme ile ilişkilendirilen bellek kullanımı yüzdesi. 0.014648443087939
network_sent_bytes bigint Ağ trafiğinde gönderilen bayt sayısı. 517376
network_received_bytes bigint Ağ trafiğinden alınan bayt sayısı. 179234
disk_free_bytes_per_mount_point harita Bağlama noktasına göre gruplandırılmış disk kullanımı. Bu, yalnızca işlem çalışırken sağlanan kısa süreli depolamadır. {"/var/lib/lxc":123455551234,"/":
123456789123,"/local_disk0":123412341234}
node_type Dize Düğüm türünün adı. Bu, bulut sağlayıcısının örnek türü adıyla eşleşecektir. Standard_D16s_v3

Bilinen sınırlamalar

  • 23 Ekim 2023'e kadar silinmiş olarak işaretlenen işlem kaynakları kümeler tablosunda görünmez. Bu, system.billing.usage tablosundan birleştirmelerin kümeler tablosundaki kayıtlarla eşleşmemesiyle sonuçlanabilir. Tüm etkin işlem kaynakları yedeklendi.
  • Bu tablolar yalnızca genel amaçlı ve iş hesaplama için kayıtları içerir. Sunucusuz işlem, DLT işlem veya SQL ambarları için kayıtlar içermez.
  • 10 dakikadan kısa bir süre boyunca çalıştırılmayan düğümler node_timeline tablosunda görünmeyebilir.

Örnek sorgular

Sık sorulan soruları yanıtlamak için aşağıdaki örnek sorguları kullanabilirsiniz:

Not

Bu örneklerden bazıları küme tablosunu system.billing.usage tablosuyla birleştirir. Bu nedenle, faturalama kayıtları bölgeye özgü olduğundan ve küme kayıtları bölge-spesifik olduğundan, faturalama kayıtları yalnızca sorguladığınız bölge için küme kayıtlarıyla eşleşir. Başka bir bölgedeki kayıtları görmek için lütfen sorguyu bu bölgede yürütür.

En son faturalama kayıtlarıyla küme kayıtlarını birleştirme

Bu sorgu, zaman içindeki harcamaları anlamanıza yardımcı olabilir. usage_start_time en güncel faturalama dönemine güncelleştirdiğinizde, küme verilerine katılmak için faturalama kayıtlarında yapılan en son güncelleştirmeleri alır.

Her kayıt, o belirli çalıştırma sırasında küme sahibiyle ilişkilendirilir. Bu nedenle, küme sahibi değişirse maliyetler, kümenin ne zaman kullanıldığına bağlı olarak doğru sahipe yuvarlanır.

SELECT
  u.record_id,
  c.cluster_id,
  c.owned_by,
  c.change_time,
  u.usage_start_time,
  u.usage_quantity
FROM
  system.billing.usage u
  JOIN system.compute.clusters c
  JOIN (SELECT u.record_id, c.cluster_id, max(c.change_time) change_time
    FROM system.billing.usage u
    JOIN system.compute.clusters c
    WHERE
      u.usage_metadata.cluster_id is not null
      and u.usage_start_time >= '2023-01-01'
      and u.usage_metadata.cluster_id = c.cluster_id
      and date_trunc('HOUR', c.change_time) <= date_trunc('HOUR', u.usage_start_time)
    GROUP BY all) config
WHERE
  u.usage_metadata.cluster_id is not null
  and u.usage_start_time >= '2023-01-01'
  and u.usage_metadata.cluster_id = c.cluster_id
  and u.record_id = config.record_id
  and c.cluster_id = config.cluster_id
  and c.change_time = config.change_time
ORDER BY cluster_id, usage_start_time desc;

En yüksek ortalama kullanıma ve maksimum kullanıma sahip hesaplama kaynaklarını belirleyin.

En yüksek ortalama CPU kullanımı ve en yüksek zirve CPU kullanımı olan çok amaçlı ve görev amaçlı hesaplamayı belirleyin.

SELECT
        distinct cluster_id,
driver,
avg(cpu_user_percent + cpu_system_percent) as `Avg CPU Utilization`,
max(cpu_user_percent + cpu_system_percent) as `Peak CPU Utilization`,
        avg(cpu_wait_percent) as `Avg CPU Wait`,
        max(cpu_wait_percent) as `Max CPU Wait`,
        avg(mem_used_percent) as `Avg Memory Utilization`,
        max(mem_used_percent) as `Max Memory Utilization`,
avg(network_received_bytes)/(1024^2) as `Avg Network MB Received per Minute`,
avg(network_sent_bytes)/(1024^2) as `Avg Network MB Sent per Minute`
FROM
        node_timeline
WHERE
        start_time >= date_add(now(), -1)
GROUP BY
        cluster_id,
        driver
ORDER BY
        3 desc;