Sistem tablolarıyla hesap etkinliğini izleme
Bu makalede Azure Databricks'teki sistem tabloları kavramı açıklanır ve sistem tabloları verilerinizden en iyi şekilde yararlanmak için kullanabileceğiniz kaynaklar vurgulanır.
Sistem tabloları nedir?
Sistem tabloları, hesabınızın system
kataloğunda bulunan işletimsel verilerinin Azure Databricks tarafından barındırılan analiz deposulardır. Sistem tabloları, hesabınızdaki geçmiş gözlemlenebilirlik için kullanılabilir.
Not
system.information_schema
belgeleri için bkz. Bilgi şeması.
Gereksinimler
- Sistem tablolarına erişmek için çalışma alanınızın Unity Kataloğu için etkinleştirilmesi gerekir. Daha fazla bilgi için bkz. sistem tablosu şemalarını etkinleştirme
.
- Sistem tabloları aşağıdaki bölgelerde kullanılamaz:
- Azure Çin bölgeleri
- Azure Kamu bölgeleri
- Batı Hindistan
- Batı İsviçre
Hangi sistem tabloları kullanılabilir?
Şu anda Azure Databricks aşağıdaki sistem tablolarını barındırıyor:
Masa | Açıklama | Konum | Akış desteği | Ücretsiz saklama süresi | Genel veya bölgesel verileri içerir |
---|---|---|---|---|---|
Denetim günlükleri (Genel Önizleme) | Bölgenizdeki çalışma alanlarındaki tüm denetim olaylarının kayıtlarını içerir. Kullanılabilir denetim olaylarının listesi için bkz. Tanılama günlüğü referansı. | system.access.audit |
Yes | 365 gün | Çalışma alanı düzeyindeki olaylar için yerel. Hesap düzeyindeki olaylar için genel. |
Tablo soy kütüğü (Genel Önizleme) | Unity Kataloğu tablosunda veya yolundaki her okuma veya yazma olayı için bir kayıt içerir. | system.access.table_lineage |
Yes | 365 gün | Bölgesel |
Sütun kökeni (Genel Önizleme) | Unity Kataloğu sütunundaki her okuma veya yazma olayı için bir kayıt içerir (ancak kaynağı olmayan olayları içermez). | system.access.column_lineage |
Yes | 365 gün | Bölgesel |
Faturalanabilir kullanım | Hesabınızdaki tüm faturalanabilir kullanımın kayıtlarını içerir. | system.billing.usage |
Yes | 365 gün | Global |
Fiyatlandırma | SKU fiyatlandırmasının geçmiş günlüğü. SKU fiyatında her değişiklik olduğunda bir kayıt eklenir. | system.billing.list_prices |
Hayır | Sınırsız | Global |
Kümeler (Genel Önizleme) | Herhangi bir küme için zaman içindeki işlem yapılandırmalarının tam geçmişini içeren yavaş değişen boyut tablosu. | system.compute.clusters |
Yes | 365 gün | Bölgesel |
Düğüm zaman çizelgesi (Genel Önizleme) | Genel amaçlı ve iş odaklı hesaplama kaynaklarınızın kullanım ölçümlerini yakalar. | system.compute.node_timeline |
Yes | 30 gün | Bölgesel |
Düğüm türleri (Genel Önizleme) | Şu anda kullanılabilir düğüm türlerini temel donanım bilgileriyle yakalar. | system.compute.node_types |
Hayır | Yok | Bölgesel |
SQL ambarları (Genel Önizleme) | Herhangi bir SQL ambarı için zaman içindeki yapılandırmaların tam geçmişini içerir. | system.compute.warehouses |
Yes | 365 gün | Bölgesel |
SQL ambarı olayları (Genel Önizleme) | SQL ambarlarıyla ilgili olayları yakalar. Örneğin, başlatma, durdurma, çalıştırma, ölçeği artırma ve azaltma. | system.compute.warehouse_events |
Yes | 365 gün | Bölgesel |
İşler (Genel Önizleme) | Hesapta oluşturulan tüm işleri izler. | system.lakeflow.jobs |
Yes | 365 gün | Bölgesel |
İş görevleri (Genel Önizleme) | Hesapta gerçekleştirilen tüm iş görevlerini takip eder. | system.lakeflow.job_tasks |
Yes | 365 gün | Bölgesel |
İş koşu zaman çizelgesi (Genel Önizleme) | İş çalıştırmalarının başlangıç ve bitiş saatlerini izler. | system.lakeflow. job_run_timeline |
Yes | 365 gün | Bölgesel |
İş görevi zaman çizelgesi (Genel Önizleme) | İş görevi çalıştırmaları için kullanılan başlangıç ve bitiş saatlerini ve işlem kaynaklarını izler. | system.lakeflow. job_task_run_timeline |
Yes | 365 gün | Bölgesel |
Pazarlama hunisi etkinlikleri (Genel Önizleme) | Listeleriniz için tüketici izlenimi ve satış hunisi verilerini içerir. | system.marketplace.listing_ funnel_events |
Yes | 365 gün | Bölgesel |
Pazaryeri listeleme erişimi (Genel Önizleme) | Tamamlanmış istek verileri veya veri alma olayları için tüketici bilgilerini listelemelerinizde içerir. | system.marketplace.listing_ access_events |
Yes | 365 gün | Bölgesel |
Tahmine dayalı iyileştirme (Genel Önizleme) | Tahmine dayalı iyileştirme özelliğinin işlem geçmişini izler. | system.storage.predictive_ optimization_operations_history |
Hayır | 180 gün | Bölgesel |
Databricks Yardımcısı etkinlikleri (Genel Önizleme) | Databricks Yardımcısı'na gönderilen kullanıcı iletilerini izler. | system.access.assistant_events |
Hayır | 365 gün | Bölgesel |
Sorgu geçmişi (Genel Önizleme) | not defterleri ve işleriiçin SQL ambarlarında ve sunucusuz işlemde çalıştırılan tüm sorguların kayıtlarını yakalar. | system.query.history |
Hayır | 90 gün | Bölgesel |
Temiz oda etkinlikleri (Genel Önizleme) | Temiz odalarla ilgili olayları yakalar. | system.access.clean_room_events |
Yes | 365 gün | Bölgesel |
Uç nokta kullanımına hizmet veren model (Genel Önizleme) | Bir model sunucu uç noktasına ve yanıtlarına yapılan her istek için belirteç sayılarını kaydeder. Bu tablodaki uç nokta kullanımını yakalamak için hizmet veren uç noktanızda kullanım izlemeyi etkinleştirmeniz gerekir. |
system.serving.endpoint_usage . |
Yes | 90 gün | Bölgesel |
Uç nokta verilerini sunan model (Genel Önizleme) | Her bir sunulan temel modelin meta verilerini bir model sunum uç noktasında depolayan yavaş değişen bir boyut tablosu. | system.serving.served_entities |
Yes | 365 gün | Bölgesel |
Ağ erişim olayları (Genel Önizleme) | Hesabınızdan İnternet erişimi her reddedildiğinde bir olayı kaydeden tablo. | system.access.outbound_network |
Yes | 365 gün | Bölgesel |
Faturalanabilir kullanım ve fiyatlandırma tabloları ücretsizdir. Genel Önizleme'deki tablolar da önizleme sırasında ücretsiz olarak kullanılabilir ancak gelecekte ücretlendirilebilir.
Not
Hesabınızda yukarıda listelenenlerin yanı sıra başka sistem tabloları da görebilirsiniz. Bu tablolar şu anda Özel Önizleme'dedir ve varsayılan olarak boş durumdadır. Bu tablolardan herhangi birini kullanmak istiyorsanız lütfen Databricks hesap ekibinize ulaşın.
Sistem tablosu şemalarını etkinleştirme
Sistem tabloları Unity Kataloğu tarafından yönetildiğinden, sistem tablolarını etkinleştirmek ve bunlara erişmek için hesabınızda en az bir Unity Kataloğu etkin çalışma alanı olmalıdır. Sistem tabloları hesabınızdaki tüm çalışma alanlarındaki verileri içerir, ancak bunlara yalnızca Unity Kataloğu'nu etkinleştiren bir çalışma alanından erişilebilir.
Sistem tabloları şema düzeyinde etkinleştirilir. Bir sistem şemasını etkinleştirirseniz, bu şemadaki tüm tabloları etkinleştirirsiniz. Yeni şemalar yayımlandığında, hesap yöneticisinin şemayı el ile etkinleştirmesi gerekir.
Sistem tabloları bir hesap yöneticisi tarafından etkinleştirilmelidir. system-schemas
komutlarını kullanarak veya SystemSchemas APIkullanarak sistem tablolarını etkinleştirebilirsiniz.
Not
billing
şeması varsayılan olarak etkindir. Diğer şemalar el ile etkinleştirilmelidir.
Kullanılabilir sistem şemalarını listeleme
Kullanılabilir sistem şemalarını listelemek için aşağıdaki curl komutunu kullanın:
curl -v -X GET -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas"
Aşağıda komutun örnek çıkışı verilmiştir GET
:
{"schemas":[{"schema":"access","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"billing","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"information_schema","state":"<AVAILABLE OR EnableCompleted>"}]}
state: AVAILABLE
: Sistem şeması kullanılabilir ancak henüz etkinleştirilmemiştir.
state: EnableCompleted
: Sistem şemasını etkinleştirdiniz ve Bu şema Katalog Gezgini'nde görünür.
Sistem şemasını etkinleştirme
Sistem şemasını etkinleştirmek için aşağıdaki curl komutunu kullanın:
curl -v -X PUT -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"
Sistem şeması başarıyla etkinleştirilirse sonuç kodu 200
döndürülür.
Bir sistem şemasını yeniden etkinleştirmeye çalışırsanız, aşağıdakiler döndürülür: "error_code":"SCHEMA_ALREADY_EXISTS","message":"Schema <schema-name> already exists"
.
Sistem şemasını devre dışı bırakma
Sistem şemasını devre dışı bırakmak için aşağıdaki curl komutunu kullanın:
curl -v -X DELETE -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"
Sistem tablolarına erişim izni verme
Sistem tablolarına erişim Unity Kataloğu'na tabidir. Hiçbir kullanıcının varsayılan olarak bu sistem şemalarına erişimi yoktur. Erişim vermek için hem meta veri deposu yöneticisi hem de hesap yöneticisi olan bir kullanıcının sistem şemalarında USE
ve SELECT
izinleri vermesi gerekir. Bkz. Unity Kataloğu'nda ayrıcalıkları yönetme.
Sistem tabloları salt okunur durumdadır ve değiştirilemez.
Not
Hesabınız 9 Kasım 2023'den sonra oluşturulduysa, varsayılan olarak bir meta veri deposu yöneticiniz olmayabilir. Daha fazla bilgi için bkz. Unity Kataloğu'nu Ayarlama ve Yönetme.
Sistem tabloları hesabınızdaki tüm çalışma alanları için veri içeriyor mu?
Sistem tabloları, hesabınızdaki aynı bulut bölgesinde dağıtılan tüm çalışma alanları için işletimsel veriler içerir. Faturalama sistemi tabloları, hesap genelinde veriler içerir.
Sistem tablolarına yalnızca Unity Kataloğu çalışma alanı üzerinden erişilebilir olsa da, tablolar hesabınızdaki Unity Kataloğu olmayan çalışma alanlarının işletimsel verilerini de içerir.
Sistem tablosu verileri nerede depolanır?
Hesabınızın sistem tablosu verileri, meta veri deponuzla aynı bölgede bulunan Azure Databricks tarafından barındırılan bir depolama hesabında depolanır. Delta Sharing kullanılarak veriler sizinle güvenli bir şekilde paylaşılır.
Her tablonun ücretsiz veri saklama süresi vardır. Saklama süresini uzatma hakkında bilgi için Azure Databricks hesap ekibinize başvurun.
Sistem tabloları Katalog Gezgini'nde nerede bulunur?
Hesabınızdaki sistem tabloları, her Unity Kataloğu meta veri deposunda bulunan system
adlı bir katalogda bulunur.
system
kataloğunda, sistem tablolarını içeren access
ve billing
gibi şemalar görürsünüz.
Akış sistemi tabloları için dikkat edilmesi gerekenler
Azure Databricks, sistem tablosu verilerini müşterilerle paylaşmak için Delta Sharing'i kullanır. Delta Sharing ile akış yaparken aşağıdaki noktalara dikkat edin:
- Sistem tablolarıyla akış kullanıyorsanız,
skipChangeCommits
seçeneğinitrue
olarak ayarlayın. Bu, akış işinin sistem tablolarındaki silmelerden kesintiye uğramamasını sağlar. Bkz. Güncelleştirmeleri ve silmeleri yoksayma. -
Trigger.AvailableNow
Delta Sharing akış işlemi ile desteklenmez.Trigger.Once
olarak dönüştürülecektir.
Akış işinizde bir tetikleyici kullanıyorsanız ve bunun en son sistem tablosu sürümüne yetişmediğini fark ederseniz Databricks işin zamanlanmış sıklığını artırmanızı önerir.
Akış sistemi tablolarından artımlı değişiklikleri okuma
spark.readStream.option("skipChangeCommits", "true").table("system.billing.usage")
Bilinen sorunlar
- Şu anda gerçek zamanlı izleme desteği bulunmuyor. Veriler gün boyunca güncelleştirilir. Son zamanlardaki bir olay için bir günlük görmüyorsanız, daha sonra tekrar kontrol edin.
-
__internal_logging
sistem tablosu şeması, dış modeller ve sağlanan aktarım hızı iş yükleri için AI Ağ Geçidi özellikli çıkarım tabloları kullanılarak yük günlüğünü desteklemek için kullanılır. Bu şema hesap yöneticileri tarafından görülebilir, ancak etkinleştirilemez ve müşteri iş akışları için kullanılmamalıdır.
- Sistem tablolarını etkinleştirmek için sistem tabloları Blob depolama uç noktasına ağ erişimi vermeniz gerekebilir. Her bölgenin sistem tablolarının depolama uç noktasının listesini görüntülemek için depolama uç noktası IP adreslerine bakın.
-
system.operational_data
vesystem.lineage
sistem şemaları kullanım dışıdır ve boş tablolar içerir.