Tabela odniesienia dla rozliczanego użycia systemu
Ten artykuł zawiera omówienie tabeli systemu użycia rozliczanego, w tym schematu i przykładowych zapytań. W przypadku tabel systemowych rozliczane dane użycia konta są scentralizowane i kierowane do wszystkich regionów, dzięki czemu można wyświetlić globalne użycie konta niezależnie od regionu, w którym jest obszar roboczy.
Aby uzyskać informacje na temat używania tej tabeli do monitorowania kosztów i przykładowych zapytań, zobacz Monitorowanie kosztów przy użyciu tabel systemowych.
ścieżka tabeli: ta tabela systemowa znajduje się w system.billing.usage
.
Schemat tabeli do rozliczenia użycia
Tabela systemu rozliczania zużycia używa następującego schematu:
Nazwa kolumny | Typ danych | opis | Przykład |
---|---|---|---|
record_id |
string | Unikatowy identyfikator dla tego rekordu użycia | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
string | Identyfikator konta, dla którego został wygenerowany ten raport | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
string | Identyfikator obszaru roboczego, z którego zostało skojarzone to użycie | 1234567890123456 |
sku_name |
string | Nazwa SKU | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
ciąg znaków | Chmura skojarzona z tym użyciem. Możliwe wartości to AWS , AZURE i GCP . |
AWS , AZURE lub GCP |
usage_start_time |
znacznik czasu | Czas rozpoczęcia istotny dla tego rekordu użycia. Informacje o strefie czasowej są rejestrowane na końcu wartości z +00:00 reprezentującą strefę czasową UTC. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
znacznik czasu | Godzina zakończenia dotycząca tego rekordu użycia. Informacje o strefie czasowej są rejestrowane na końcu wartości z +00:00 reprezentującą strefę czasową UTC. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
data | Data rekordu użycia, to pole może służyć do szybszej agregacji według daty | 2023-01-01 |
custom_tags |
mapa | Tagi niestandardowe skojarzone z rekordem użycia | { “env”: “production” } |
usage_unit |
string | Jednostka, w której mierzy się to użycie | DBU |
usage_quantity |
dziesiętny | Liczba jednostek zużytych dla tego rekordu | 259.2958 |
usage_metadata |
struktura | Metadane dostarczone przez system dotyczące użycia, w tym identyfikatory zasobów obliczeniowych i zadań (jeśli dotyczy). Sprawdź metadane użycia. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struktura | Metadane udostępniane przez system dotyczące tożsamości związanych z użyciem. Zobacz Identity Metadata. | Zapoznaj się z metadanymi tożsamości |
record_type |
string | Niezależnie od tego, czy rekord jest oryginalny, wycofanie, czy też sprostowanie. Wartość jest ORIGINAL , chyba że rekord jest powiązany z korektą. Zobacz typ rekordu. |
ORIGINAL |
ingestion_date |
data | Data zaimportowania rekordu do tabeli w usage |
2024-01-01 |
billing_origin_product |
string | Produkt, który zainicjował użycie. Niektóre produkty mogą być rozliczane jako różne jednostki SKU. Aby uzyskać możliwe wartości, zobacz Produkt. | JOBS |
product_features |
struktura | Szczegółowe informacje o używanych funkcjach produktu. Zobacz funkcje produktu . | Zobacz Funkcje Produktu |
usage_type |
string | Typ użycia przypisany do produktu lub obciążenia na potrzeby rozliczeń. Możliwe wartości to COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , NETWORK_HOUR , API_OPERATION , TOKEN lub GPU_TIME . |
STORAGE_SPACE |
Dokumentacja dotycząca metadanych użycia
Wartości w usage_metadata
informują o obiektach i zasobach zaangażowanych w rekord użycia.
Wartość | Typ danych | opis |
---|---|---|
cluster_id |
string | Identyfikator klastra skojarzonego z rekordem użycia |
warehouse_id |
string | Identyfikator usługi SQL Warehouse skojarzonej z rekordem użycia |
instance_pool_id |
string | Identyfikator puli wystąpień skojarzonej z rekordem użycia |
node_type |
string | Typ instancji zasobu obliczeniowego |
job_id |
string | Identyfikator zadania skojarzonego z rekordem użycia.
Zwraca wartość tylko dla bezserwerowych obliczeń lub użycia zasobów obliczeniowych dla zadań, w przeciwnym razie zwraca null . |
job_run_id |
ciąg znaków | Identyfikator przebiegu zadania skojarzonego z rekordem użycia.
Zwraca wartość tylko dla wykorzystania obliczeń bezserwerowych lub obliczeń dla zadań. W przeciwnym razie zwraca null . |
job_name |
string | Nadana przez użytkownika nazwa zadania skojarzonego z rekordem użycia.
Zwraca tylko wartość dla zadań uruchamianych w obliczeniach bezserwerowych. W przeciwnym razie zwraca wartość null . |
notebook_id |
string | Identyfikator notesu skojarzonego z użyciem.
Wartość jest zwracana tylko w przypadku użycia obliczeń bezserwerowych w notatniku, w przeciwnym razie zwraca null . |
notebook_path |
string | Ścieżka przechowywania w obszarze roboczym notesu związanego z użyciem.
Zwraca wartość obliczeń w chmurze tylko w przypadku użycia notatnika. W przeciwnym razie zwraca null . |
dlt_pipeline_id |
string | Identyfikator potoku DLT skojarzonego z rekordem użycia |
dlt_update_id |
string | ID aktualizacji potoku DLT powiązanej z rekordem użycia |
dlt_maintenance_id |
string | Identyfikator zadań konserwacji potoku DLT skojarzonych z rekordem użycia |
run_name |
string | Unikatowy identyfikator skierowany do użytkownika dla dostrajania Modelu Podstawowego, powiązany z rekordem użycia |
endpoint_name |
string | Nazwa modelu obsługującego punkt końcowy lub punkt końcowy wyszukiwania wektorów skojarzony z rekordem użycia |
endpoint_id |
string | Identyfikator modelu obsługującego punkt końcowy lub punkt końcowy wyszukiwania wektorów skojarzony z rekordem użycia |
central_clean_room_id |
struna | Identyfikator centralnego czystego pomieszczenia skojarzonego z rekordem użycia |
source_region |
string | Region obszaru roboczego skojarzonego z użyciem. Zwraca wartość tylko dla kosztów związanych z siecią. |
destination_region |
string | Region uzyskiwanego dostępu do zasobu. Zwraca wartość tylko dla kosztów związanych z siecią. |
metastore_id |
string | Identyfikator magazynu metadanych skojarzonego z rekordem użycia |
app_id |
string | Identyfikator aplikacji skojarzonej z rekordem użycia |
app_name |
string | Nadana przez użytkownika nazwa aplikacji skojarzonej z rekordem użycia |
private_endpoint_name |
string | Nazwa odpowiedniego prywatnego punktu końcowego. Zwraca wartość tylko dla kosztów związanych z siecią. |
Odniesienie do metadanych tożsamości
Kolumna identity_metadata
dostarcza więcej informacji o tożsamościach zaangażowanych w użytkowanie. Pole run_as
rejestruje, kto uruchomił obciążenie. Pole owned_by
dotyczy tylko użycia usługi SQL Warehouse i rejestruje użytkownika lub jednostkę usługi, która jest właścicielem usługi SQL Warehouse odpowiedzialnej za użycie.
Ponadto użycie przypisane do usługi Databricks Apps rejestruje wartość w polu identity_metadata.created_by
. Ta wartość jest wypełniana pocztą e-mail użytkownika, który utworzył aplikację.
tożsamości uruchamiane jako
Tożsamość zarejestrowana w pliku identity_metadata.run_as
zależy od produktu skojarzonego z użyciem. Proszę odnieść się do poniższej tabeli w celu zapoznania się z zachowaniem identity_metadata.run_as
.
Typ obciążenia | Tożsamość run_as |
---|---|
Zadania obliczane | Użytkownik lub jednostka usługi zdefiniowana w ustawieniu run_as . Domyślnie zadania są uruchamiane jako tożsamość właściciela zadania, ale administratorzy mogą zmienić to na innego użytkownika lub jednostki usługi. |
Bezserwerowe obliczenia dla zadań | Użytkownik lub jednostka usługi zdefiniowana w ustawieniu run_as . Domyślnie zadania są uruchamiane z uprawnieniami właściciela zadania, ale administratorzy mogą to zmienić na innego użytkownika lub konto serwisowe. |
Obliczenia bezserwerowe dla notatników | Użytkownik, który uruchomił polecenia notesu (właśnie tego użytkownika, który utworzył sesję notesu). W przypadku notesów udostępnionych obejmuje to użycie przez innych użytkowników korzystających z tej samej sesji notesu. |
Potoki DLT | Użytkownik, którego uprawnienia są wykorzystywane do uruchamiania potoku DLT. Można to zmienić, przenosząc własność potoku. |
Dostrajanie modelu podstawowego | Użytkownik lub podmiot usługi, który zainicjował proces szkolenia w ramach dostrajania. |
Optymalizacja predykcyjna | Główna jednostka serwisowa Databricks, która uruchamia operacje optymalizacji predykcyjnej. |
Monitorowanie usługi Lakehouse | Użytkownik, który utworzył monitor. |
Odniesienie do typu rekordu
Tabela billing.usage
obsługuje poprawki. Poprawki występują, gdy dowolne pole rekordu użycia jest nieprawidłowe i należy je naprawić.
Gdy wystąpi korekta, usługa Azure Databricks dodaje do tabeli dwa nowe rekordy. Rekord wycofania neguje oryginalny błędny rekord, a następnie rekord ponownego sformułowania zawiera poprawione informacje. Rekordy poprawek są identyfikowane przy użyciu record_type
pola:
-
RETRACTION
: służy do negowania oryginalnego nieprawidłowego użycia. Wszystkie pola są identyczne z rekordemORIGINAL
z wyjątkiemusage_quantity
wartości ujemnej, która anuluje oryginalną ilość użycia. Jeśli na przykład ilość użycia oryginalnego rekordu to259.4356
, rekord wycofywania będzie miał ilość-259.4356
użycia . -
RESTATEMENT
: Rekord zawierający poprawne pola i ilość użycia.
Na przykład następujące zapytanie zwraca poprawną ilość użycia godzinowego powiązaną z wartością job_id
, nawet jeśli zostały wprowadzone poprawki. Agregując wielkość zużycia, zapis anulujący neguje oryginalny zapis i zwracane są tylko wartości korekty.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Uwaga
W przypadku poprawek, w których oryginalny rekord użycia nie powinien być zapisywany, korekta może dodać tylko rekord wycofania, bez rekordu zmiany.
referencja produktu źródła rozliczeń
Niektóre produkty usługi Databricks są rozliczane w ramach tej samej udostępnionej jednostki SKU. Aby ułatwić odróżnienie użycia, kolumny billing_origin_product
i product_features
zapewniają lepszy wgląd w konkretny produkt i funkcje skojarzone z użyciem.
W kolumnie billing_origin_product
jest wyświetlany produkt usługi Databricks skojarzony z rekordem użycia. Wartości obejmują:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
-
NETWORKING
: Koszty związane z łączeniem obliczeń bezserwerowych z zasobami za pośrednictwem prywatnych punktów końcowych. W przypadku użyciaNETWORKING
workspace_id
jestnull
,usage_unit
jesthour
, anetworking.connectivity_type
jestPRIVATE_IP
. -
APPS
: koszty związane z kompilowaniem i uruchamianiem usługi Databricks Apps
Odniesienie do cech produktu
Kolumna product_features
jest obiektem zawierającym informacje o określonych używanych funkcjach produktu i zawiera następujące pary klucz/wartość:
-
jobs_tier
: wartości obejmująLIGHT
,CLASSIC
lubnull
-
sql_tier
: wartości obejmująCLASSIC
,PRO
lubnull
-
dlt_tier
: wartości obejmująCORE
,PRO
,ADVANCED
lubnull
-
is_serverless
: wartości obejmujątrue
lubfalse
lubnull
-
is_photon
: wartości obejmujątrue
lubfalse
lubnull
-
serving_type
: wartości obejmująMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
lubnull
-
networking.connectivity_type
: wartości obejmująPUBLIC_IP
iPRIVATE_IP