Dokumentacja konfiguracji
Ten artykuł dostarcza odniesienia do kluczy obsługiwanych przez konfigurację pakietów zasobów Databricks (YAML). Zobacz Co to są pakiety zasobów usługi Databricks?.
Aby zapoznać się z kompletnymi przykładami pakietów, zobacz przykłady konfiguracji pakietu i oraz repozytorium na GitHubie bundle-examples.
artefakt
Definiuje ustawienia do utworzenia artefaktu.
Klucz | Typ | Opis |
---|---|---|
build |
Struna | Opcjonalny zestaw poleceń kompilacji do uruchamiania lokalnie przed wdrożeniem. |
executable |
Struna | Typ pliku wykonywalnego. Prawidłowe wartości to bash , sh i cmd . |
files |
Mapa | Ścieżka względna lub bezwzględna do skompilowanych plików artefaktów zdefiniowanych jako artifact_file. |
path |
Struna | Ścieżka lokalna katalogu artefaktu. |
type |
Struna | Wymagane, jeśli artefakt jest kołem języka Python. Typ artefaktu. Prawidłowe wartości to whl i jar . |
Artefakty
Definiuje atrybuty do tworzenia artefaktów, gdzie każdy klucz jest nazwą artefaktu, a wartość jest mapą definiującą ustawienia kompilacji artefaktu . Aby uzyskać informacje o mapowaniu artifacts
, zobacz artefakty .
Ustawienia artefaktu zdefiniowane na najwyższym poziomie konfiguracji pakietu można zastąpić w mapowaniu targets
. Zobacz Define artifact settings in Databricks Asset Bundles (Definiowanie ustawień artefaktu w pakietach zasobów usługi Databricks).
artifacts:
<artifact-name>:
<artifact-field-name>: <artifact-field-value>
Przykład
artifacts:
default:
type: whl
build: poetry build
path: .
plik_artefaktu
Definiuje plik artefaktu w pakiecie.
Klucz | Typ | Opis |
---|---|---|
source |
Struna | Wymagane. Plik źródłowy artefaktu. |
pakiet
Atrybuty pakietu. Zobacz pakiet.
Klucz | Typ | Opis |
---|---|---|
cluster_id |
Struna | Identyfikator klastra do uruchomienia pakietu. Zobacz cluster_id. |
databricks_cli_version |
Struna | Wersja interfejsu wiersza polecenia usługi Databricks do użycia dla pakietu. Zobacz databricks_cli_version. |
deployment |
Mapa | Definicja wdrożenia pakietu. Aby uzyskać informacje o obsługiwanych atrybutach, zobacz wdrażanie i Tryby wdrażania pakietu zasobów usługi Databricks. |
git |
Mapa | Szczegóły kontroli wersji usługi Git skojarzone z Twoim pakietem. Aby uzyskać informacje o obsługiwanych atrybutach, zobacz git i git. |
name |
Struna | Wymagane. Nazwa pakietu. |
uuid |
Struna | Zastrzeżony. Uniwersalny unikatowy identyfikator (UUID) dla pakietu, który jednoznacznie identyfikuje pakiet w wewnętrznych systemach usługi Databricks. Jest to generowane, gdy projekt pakietu jest inicjowany przy użyciu szablonu usługi Databricks (przy użyciu polecenia databricks bundle init ). |
Wdrożenie
Definiuje atrybuty wdrożenia pakietu.
Klucz | Typ | Opis |
---|---|---|
fail_on_active_runs |
Wartość logiczna | Czy zakończyć niepowodzeniem aktywne przebiegi. Jeśli jest to ustawione na true wdrożenie, które jest uruchomione, może zostać przerwane. |
lock |
Mapa | Atrybuty blokady wdrożenia. Zobacz lock. |
eksperymentalny
Definiuje atrybuty dla funkcji eksperymentalnych.
Klucz | Typ | Opis |
---|---|---|
python_wheel_wrapper |
Wartość logiczna | Czy używać opakowania typu wheel dla języka Python? |
scripts |
Polecenie (ciąg) | Polecenia do uruchomienia |
use_legacy_run_as |
Wartość logiczna | Czy używać starszego zachowania funkcji run_as. |
Git
Definiuje szczegóły kontroli wersji usługi Git skojarzone z pakietem. Zobacz git.
Klucz | Typ | Opis |
---|---|---|
origin_url |
Struna | Adres URL źródła repozytorium. Zobacz git. |
branch |
Struna | Nazwa gałęzi Git. Zobacz git. |
dotacja
Definiuje dostęp do obiektów katalogu Unity Catalog. Aby uzyskać więcej informacji, zobacz Jak połączyć się z magazynem obiektów w chmurze i usługami za pomocą katalogu Unity.
Klucz | Typ | Opis |
---|---|---|
principal |
Struna | Wymagane. Nazwa głównego podmiotu, któremu zostaną przyznane uprawnienia. |
privileges |
Struna | Wymagane. Uprawnienia do przyznania określonemu podmiotowi. |
Przykład
W poniższym przykładzie zdefiniowano schemat Unity Catalog z grantami.
resources:
schemas:
my_schema:
name: test-schema
grants:
- principal: users
privileges:
- CAN_MANAGE
- principal: my_team
privileges:
- CAN_READ
catalog_name: main
comment: "my schema with grants"
zamek
Definiuje atrybuty blokady wdrożenia pakietu.
Klucz | Typ | Opis |
---|---|---|
enabled |
Wartość logiczna | Czy ta blokada jest włączona. |
force |
Wartość logiczna | Czy wymusić tę blokadę, jeśli jest włączona. |
pozwolenie
Definiuje uprawnienie dla określonej jednostki. Zobacz uprawnienia oraz Ustaw uprawnienia dla zasobów w pakietach zasobów Databricks.
Klucz | Typ | Opis |
---|---|---|
group_name |
Struna | Nazwa grupy, która ma uprawnienie ustawione w level . |
level |
Struna | Wymagane. Dozwolone uprawnienie dla użytkownika, grupy, głównej jednostki usługi, zdefiniowane dla tego uprawnienia. |
service_principal_name |
Struna | Nazwa jednostki usługi, która ma uprawnienie ustawione w level . |
user_name |
Struna | Nazwa użytkownika, który ma uprawnienie ustawione w level . |
Uprawnienia
Sekwencja, która definiuje uprawnienia stosowane do eksperymentów, zadań, potoków i modeli zdefiniowanych w pakiecie, gdzie każdy element w sekwencji jest to uprawnienie dla konkretnego obiektu.
Zobacz uprawnienia oraz Ustaw uprawnienia dla zasobów w pakietach zasobów Databricks.
Przykład
permissions:
- level: CAN_VIEW
group_name: test-group
- level: CAN_MANAGE
user_name: someone@example.com
- level: CAN_RUN
service_principal_name: 123456-abcdef
Ustawień
Definiuje domyślne ustawienia wdrożenia pakietu. Zobacz Niestandardowe ustawienia wstępne.
Klucz | Typ | Opis |
---|---|---|
jobs_max_concurrent_runs |
Liczba całkowita | Maksymalna liczba współbieżnych przebiegów dla zadania. |
name_prefix |
Struna | Prefiks dla przebiegów zadań pakietu. |
pipelines_development |
Wartość logiczna | Określa, czy wdrożenia potoków powinny być zablokowane w trybie programowania. |
source_linked_deployment |
Wartość logiczna | Czy połączyć wdrożenie ze źródłem pakietu. |
tags |
Mapa | Tagi wdrożenia pakietu. |
trigger_pause_status |
Struna | Stan wstrzymania, który ma być stosowany do wszystkich wyzwalaczy i harmonogramów zadań. Prawidłowe wartości to PAUSED lub UNPAUSED . |
zasoby
Mapa, która definiuje zasoby dla pakietu, gdzie każdy klucz jest nazwą zasobu, a wartość jest mapą definiującą zasób. Aby uzyskać więcej informacji na temat zasobów obsługiwanych przez pakiety Databricks oraz dokumentacji definicji zasobów, zobacz zasoby pakietów Databricks.
resources:
<resource-type>s:
<resource-name>:
<resource-field-name>: <resource-field-value>
Klucz | Typ | Opis |
---|---|---|
clusters |
Mapa | Definicje klastra dla pakietu, gdzie każdy klucz jest nazwą klastra. Zobacz klaster |
dashboards |
Mapa | Definicje pulpitu nawigacyjnego dla pakietu, w których każdy klucz jest nazwą pulpitu nawigacyjnego. Zobacz pulpit nawigacyjny |
experiments |
Mapa | Definicje eksperymentów dla pakietu, w których każdy klucz jest nazwą eksperymentu. Zobacz eksperyment |
jobs |
Mapa | Definicje zadań dla pakietu, gdzie każdy klucz jest nazwą zadania. Zobacz zadanie |
model_serving_endpoints |
Mapa | Model obsługujący definicje punktów końcowych dla pakietu, w którym każdy klucz jest nazwą punktu końcowego obsługującego model. Zobacz model_serving_endpoint |
models |
Mapa | Definicje modelu dla pakietu, gdzie każdy klucz jest nazwą modelu. Zobacz model (starsza wersja) |
pipelines |
Mapa | Definicje przepływów pracy dla pakietu, gdzie każdy klucz jest nazwą przepływu pracy. Zobacz potok |
quality_monitors |
Mapa | Definicje monitora jakości dla pakietu, gdzie każdy klucz jest nazwą monitora jakości. Zobacz quality_monitor (Unity Catalog) katalogu |
registered_models |
Mapa | Zarejestrowane definicje modeli dla pakietu, gdzie każdy klucz to nazwa modelu zarejestrowanego w Unity Catalog. Zobacz registered_model (Unity Catalog) |
schemas |
Mapa | Definicje schematu dla pakietu, gdzie każdy klucz jest nazwą schematu. Zobacz schemat (Unity Catalog) |
volumes |
Mapa | Definicje woluminów dla pakietu, gdzie każdy klucz jest nazwą woluminu. Zobacz wolumen (Unity Catalog) |
uruchom_jako
Identyfikator tożsamości używany przy uruchamianiu przepływów pracy pakietów zasobów Databricks. Zobacz Określ tożsamość przebiegu dla przepływu pracy pakietów zasobów usługi Databricks.
Klucz | Typ | Opis |
---|---|---|
service_principal_name |
Struna | Identyfikator aplikacji aktywnej jednostki usługi. Ustawienie tego pola wymaga roli servicePrincipal/user . |
user_name |
Struna | Adres e-mail aktywnego użytkownika obszaru roboczego. Użytkownicy niebędący administratorami mogą ustawić to pole tylko na własną wiadomość e-mail. |
synchronizować
Pliki i ścieżki plików do uwzględnienia lub wykluczenia w pakiecie. Zobacz sync.
Klucz | Typ | Opis |
---|---|---|
exclude |
Kolejność | Lista plików lub folderów do wykluczenia z pakietu. |
include |
Kolejność | Lista plików lub folderów do uwzględnienia w pakiecie. |
paths |
Kolejność | Ścieżki folderów lokalnych, które mogą znajdować się poza głównym katalogiem pakietu, przeznaczone do synchronizacji z obszarem roboczym po wdrożeniu pakietu. |
cel
Definiuje cele wdrożenia dla pakietu. Zobacz targets
Klucz | Typ | Opis |
---|---|---|
artifacts |
Mapa | Artefakty do uwzględnienia w wdrożeniu docelowym. Zobacz artefakty. |
bundle |
Mapa | Atrybuty pakietu podczas wdrażania na tym docelowym środowisku. |
cluster_id |
Struna | Identyfikator klastra do użycia dla tego obiektu docelowego. |
compute_id |
Struna | Przestarzałe. Identyfikator zasobu obliczeniowego do użycia dla tego obiektu docelowego. |
default |
Wartość logiczna | Czy ten element jest domyślnym obiektem docelowym? |
git |
Mapa | Ustawienia kontroli wersji usługi Git dla miejsca docelowego. Zobacz git. |
mode |
Struna | Tryb wdrażania dla obiektu docelowego. Prawidłowe wartości to development lub production . Zobacz Tryby wdrażania zasobów pakietu usługi Databricks. |
permissions |
Kolejność | Uprawnienia do wdrażania i uruchamiania pakietu w obiekcie docelowym. Zobacz uprawnienia. |
presets |
Mapa | Ustawienia wstępne wdrożenia dla obiektu docelowego. Zobacz ustawienia wstępne . |
resources |
Mapa | Definicje zasobów dla obiektu docelowego. Zobacz zasoby. |
run_as |
Mapa | Tożsamość używana do uruchamiania pakietu. Zobacz run_as i Określ tożsamość przebiegu dla przepływu pracy pakietów zasobów usługi Databricks. |
sync |
Mapa | Lokalne ścieżki do synchronizacji z docelową przestrzenią roboczą podczas uruchamiania lub wdrażania pakietu. Zobacz sync. |
variables |
Mapa | Definicje zmiennych niestandardowych dla obiektu docelowego. Zobacz zmienne , substytucje oraz zmienne w pakietach zasobów usługi Databricks. |
workspace |
Mapa | Obszar roboczy usługi Databricks dla obiektu docelowego. obszaru roboczego |
Zmiennych
Mapa, która definiuje zmienne niestandardowe dla pakietu, gdzie każdy klucz jest nazwą zmiennej, a wartość jest mapą, która definiuje zmienną. Zobacz Podstawienia i zmienne w pakietach zasobów Databricks.
Klucz | Typ | Opis |
---|---|---|
nazwa-zmiennej | Mapa | Definicja zmiennej. Zobacz nazwa-zmiennej. |
nazwa-zmiennej
Każda definicja zmiennej ma następujące atrybuty:
Klucz | Typ | Opis |
---|---|---|
description |
Struna | Opis zmiennej. |
lookup |
Struna | Nazwa alert , cluster_policy , cluster , dashboard , instance_pool , job , metastore , pipeline , query , service_principal lub obiektu warehouse , dla którego ma pobrać identyfikator. |
type |
Struna | Typ zmiennej. Prawidłowe wartości to complex . |
obszar roboczy
Definiuje obszar roboczy usługi Databricks dla pakietu. Zobacz obszar roboczy.
Klucz | Typ | Opis |
---|---|---|
artifact_path |
Struna | Ścieżka artefaktu do użycia w obszarze roboczym zarówno dla wdrożeń, jak i przebiegów przepływu pracy |
auth_type |
Struna | Typ uwierzytelniania. |
azure_client_id |
Struna | Identyfikator klienta platformy Azure. |
azure_environment |
Struna | Środowisko platformy Azure. |
azure_login_app_id |
Struna | Identyfikator aplikacji logowania platformy Azure. |
azure_tenant_id |
Struna | Identyfikator dzierżawy platformy Azure. |
azure_use_msi |
Wartość logiczna | Czy należy używać tożsamości zarządzanej w usłudze Azure? |
azure_workspace_resource_id |
Struna | Identyfikator zasobu obszaru roboczego platformy Azure. |
client_id |
Struna | Identyfikator klienta dla obszaru roboczego. |
file_path |
Struna | Ścieżka pliku w obszarze roboczym do użycia zarówno dla wdrożeń, jak i uruchomień przepływu pracy. |
google_service_account |
Struna | Nazwa konta usługi Google. |
host |
Struna | Adres URL hosta platformy obszaru roboczego Databricks. |
profile |
Struna | Nazwa profilu obszaru roboczego usługi Databricks. |
resource_path |
Struna | Ścieżka zasobu obszaru roboczego. |
root_path |
Struna | Ścieżka główna obszaru roboczego usługi Databricks. |
state_path |
Struna | Ścieżka stanu obszaru roboczego. |