Dokumentacja konfiguracji

Artykuł
02/05/2025

Ten artykuł dostarcza odniesienia do kluczy obsługiwanych przez konfigurację pakietów zasobów Databricks (YAML). Zobacz Co to są pakiety zasobów usługi Databricks?.

Aby zapoznać się z kompletnymi przykładami pakietów, zobacz przykłady konfiguracji pakietu i oraz repozytorium na GitHubie bundle-examples.

artefakt

Definiuje ustawienia do utworzenia artefaktu.

Klucz	Typ	Opis
`build`	Struna	Opcjonalny zestaw poleceń kompilacji do uruchamiania lokalnie przed wdrożeniem.
`executable`	Struna	Typ pliku wykonywalnego. Prawidłowe wartości to `bash`, `sh`i `cmd`.
`files`	Mapa	Ścieżka względna lub bezwzględna do skompilowanych plików artefaktów zdefiniowanych jako artifact_file.
`path`	Struna	Ścieżka lokalna katalogu artefaktu.
`type`	Struna	Wymagane, jeśli artefakt jest kołem języka Python. Typ artefaktu. Prawidłowe wartości to `whl` i `jar`.

Artefakty

Definiuje atrybuty do tworzenia artefaktów, gdzie każdy klucz jest nazwą artefaktu, a wartość jest mapą definiującą ustawienia kompilacji artefaktu . Aby uzyskać informacje o mapowaniu artifacts, zobacz artefakty .

Ustawienia artefaktu zdefiniowane na najwyższym poziomie konfiguracji pakietu można zastąpić w mapowaniu targets. Zobacz Define artifact settings in Databricks Asset Bundles (Definiowanie ustawień artefaktu w pakietach zasobów usługi Databricks).

artifacts:
  <artifact-name>:
      <artifact-field-name>: <artifact-field-value>

Przykład

artifacts:
  default:
    type: whl
    build: poetry build
    path: .

plik_artefaktu

Definiuje plik artefaktu w pakiecie.

Klucz	Typ	Opis
`source`	Struna	Wymagane. Plik źródłowy artefaktu.

pakiet

Atrybuty pakietu. Zobacz pakiet.

Klucz	Typ	Opis
`cluster_id`	Struna	Identyfikator klastra do uruchomienia pakietu. Zobacz cluster_id.
`databricks_cli_version`	Struna	Wersja interfejsu wiersza polecenia usługi Databricks do użycia dla pakietu. Zobacz databricks_cli_version.
`deployment`	Mapa	Definicja wdrożenia pakietu. Aby uzyskać informacje o obsługiwanych atrybutach, zobacz wdrażanie i Tryby wdrażania pakietu zasobów usługi Databricks.
`git`	Mapa	Szczegóły kontroli wersji usługi Git skojarzone z Twoim pakietem. Aby uzyskać informacje o obsługiwanych atrybutach, zobacz git i git.
`name`	Struna	Wymagane. Nazwa pakietu.
`uuid`	Struna	Zastrzeżony. Uniwersalny unikatowy identyfikator (UUID) dla pakietu, który jednoznacznie identyfikuje pakiet w wewnętrznych systemach usługi Databricks. Jest to generowane, gdy projekt pakietu jest inicjowany przy użyciu szablonu usługi Databricks (przy użyciu polecenia `databricks bundle init`).

Wdrożenie

Definiuje atrybuty wdrożenia pakietu.

Klucz	Typ	Opis
`fail_on_active_runs`	Wartość logiczna	Czy zakończyć niepowodzeniem aktywne przebiegi. Jeśli jest to ustawione na `true` wdrożenie, które jest uruchomione, może zostać przerwane.
`lock`	Mapa	Atrybuty blokady wdrożenia. Zobacz lock.

eksperymentalny

Definiuje atrybuty dla funkcji eksperymentalnych.

Klucz	Typ	Opis
`python_wheel_wrapper`	Wartość logiczna	Czy używać opakowania typu wheel dla języka Python?
`scripts`	Polecenie (ciąg)	Polecenia do uruchomienia
`use_legacy_run_as`	Wartość logiczna	Czy używać starszego zachowania funkcji run_as.

Git

Definiuje szczegóły kontroli wersji usługi Git skojarzone z pakietem. Zobacz git.

Klucz	Typ	Opis
`origin_url`	Struna	Adres URL źródła repozytorium. Zobacz git.
`branch`	Struna	Nazwa gałęzi Git. Zobacz git.

dotacja

Definiuje dostęp do obiektów katalogu Unity Catalog. Aby uzyskać więcej informacji, zobacz Jak połączyć się z magazynem obiektów w chmurze i usługami za pomocą katalogu Unity.

Klucz	Typ	Opis
`principal`	Struna	Wymagane. Nazwa głównego podmiotu, któremu zostaną przyznane uprawnienia.
`privileges`	Struna	Wymagane. Uprawnienia do przyznania określonemu podmiotowi.

Przykład

W poniższym przykładzie zdefiniowano schemat Unity Catalog z grantami.

resources:
  schemas:
    my_schema:
      name: test-schema
      grants:
        - principal: users
          privileges:
            - CAN_MANAGE
        - principal: my_team
          privileges:
            - CAN_READ
      catalog_name: main
      comment: "my schema with grants"

zamek

Definiuje atrybuty blokady wdrożenia pakietu.

Klucz	Typ	Opis
`enabled`	Wartość logiczna	Czy ta blokada jest włączona.
`force`	Wartość logiczna	Czy wymusić tę blokadę, jeśli jest włączona.

pozwolenie

Definiuje uprawnienie dla określonej jednostki. Zobacz uprawnienia oraz Ustaw uprawnienia dla zasobów w pakietach zasobów Databricks.

Klucz	Typ	Opis
`group_name`	Struna	Nazwa grupy, która ma uprawnienie ustawione w `level`.
`level`	Struna	Wymagane. Dozwolone uprawnienie dla użytkownika, grupy, głównej jednostki usługi, zdefiniowane dla tego uprawnienia.
`service_principal_name`	Struna	Nazwa jednostki usługi, która ma uprawnienie ustawione w `level`.
`user_name`	Struna	Nazwa użytkownika, który ma uprawnienie ustawione w `level`.

Uprawnienia

Sekwencja, która definiuje uprawnienia stosowane do eksperymentów, zadań, potoków i modeli zdefiniowanych w pakiecie, gdzie każdy element w sekwencji jest to uprawnienie dla konkretnego obiektu.

Zobacz uprawnienia oraz Ustaw uprawnienia dla zasobów w pakietach zasobów Databricks.

Przykład

permissions:
  - level: CAN_VIEW
    group_name: test-group
  - level: CAN_MANAGE
    user_name: someone@example.com
  - level: CAN_RUN
    service_principal_name: 123456-abcdef

Ustawień

Definiuje domyślne ustawienia wdrożenia pakietu. Zobacz Niestandardowe ustawienia wstępne.

Klucz	Typ	Opis
`jobs_max_concurrent_runs`	Liczba całkowita	Maksymalna liczba współbieżnych przebiegów dla zadania.
`name_prefix`	Struna	Prefiks dla przebiegów zadań pakietu.
`pipelines_development`	Wartość logiczna	Określa, czy wdrożenia potoków powinny być zablokowane w trybie programowania.
`source_linked_deployment`	Wartość logiczna	Czy połączyć wdrożenie ze źródłem pakietu.
`tags`	Mapa	Tagi wdrożenia pakietu.
`trigger_pause_status`	Struna	Stan wstrzymania, który ma być stosowany do wszystkich wyzwalaczy i harmonogramów zadań. Prawidłowe wartości to `PAUSED` lub `UNPAUSED`.

zasoby

Mapa, która definiuje zasoby dla pakietu, gdzie każdy klucz jest nazwą zasobu, a wartość jest mapą definiującą zasób. Aby uzyskać więcej informacji na temat zasobów obsługiwanych przez pakiety Databricks oraz dokumentacji definicji zasobów, zobacz zasoby pakietów Databricks.

resources:
  <resource-type>s:
    <resource-name>:
      <resource-field-name>: <resource-field-value>

Klucz	Typ	Opis
`clusters`	Mapa	Definicje klastra dla pakietu, gdzie każdy klucz jest nazwą klastra. Zobacz klaster
`dashboards`	Mapa	Definicje pulpitu nawigacyjnego dla pakietu, w których każdy klucz jest nazwą pulpitu nawigacyjnego. Zobacz pulpit nawigacyjny
`experiments`	Mapa	Definicje eksperymentów dla pakietu, w których każdy klucz jest nazwą eksperymentu. Zobacz eksperyment
`jobs`	Mapa	Definicje zadań dla pakietu, gdzie każdy klucz jest nazwą zadania. Zobacz zadanie
`model_serving_endpoints`	Mapa	Model obsługujący definicje punktów końcowych dla pakietu, w którym każdy klucz jest nazwą punktu końcowego obsługującego model. Zobacz model_serving_endpoint
`models`	Mapa	Definicje modelu dla pakietu, gdzie każdy klucz jest nazwą modelu. Zobacz model (starsza wersja)
`pipelines`	Mapa	Definicje przepływów pracy dla pakietu, gdzie każdy klucz jest nazwą przepływu pracy. Zobacz potok
`quality_monitors`	Mapa	Definicje monitora jakości dla pakietu, gdzie każdy klucz jest nazwą monitora jakości. Zobacz quality_monitor (Unity Catalog) katalogu
`registered_models`	Mapa	Zarejestrowane definicje modeli dla pakietu, gdzie każdy klucz to nazwa modelu zarejestrowanego w Unity Catalog. Zobacz registered_model (Unity Catalog)
`schemas`	Mapa	Definicje schematu dla pakietu, gdzie każdy klucz jest nazwą schematu. Zobacz schemat (Unity Catalog)
`volumes`	Mapa	Definicje woluminów dla pakietu, gdzie każdy klucz jest nazwą woluminu. Zobacz wolumen (Unity Catalog)

uruchom_jako

Identyfikator tożsamości używany przy uruchamianiu przepływów pracy pakietów zasobów Databricks. Zobacz Określ tożsamość przebiegu dla przepływu pracy pakietów zasobów usługi Databricks.

Klucz	Typ	Opis
`service_principal_name`	Struna	Identyfikator aplikacji aktywnej jednostki usługi. Ustawienie tego pola wymaga roli `servicePrincipal/user`.
`user_name`	Struna	Adres e-mail aktywnego użytkownika obszaru roboczego. Użytkownicy niebędący administratorami mogą ustawić to pole tylko na własną wiadomość e-mail.

synchronizować

Pliki i ścieżki plików do uwzględnienia lub wykluczenia w pakiecie. Zobacz sync.

Klucz	Typ	Opis
`exclude`	Kolejność	Lista plików lub folderów do wykluczenia z pakietu.
`include`	Kolejność	Lista plików lub folderów do uwzględnienia w pakiecie.
`paths`	Kolejność	Ścieżki folderów lokalnych, które mogą znajdować się poza głównym katalogiem pakietu, przeznaczone do synchronizacji z obszarem roboczym po wdrożeniu pakietu.

cel

Definiuje cele wdrożenia dla pakietu. Zobacz targets

Klucz	Typ	Opis
`artifacts`	Mapa	Artefakty do uwzględnienia w wdrożeniu docelowym. Zobacz artefakty.
`bundle`	Mapa	Atrybuty pakietu podczas wdrażania na tym docelowym środowisku.
`cluster_id`	Struna	Identyfikator klastra do użycia dla tego obiektu docelowego.
`compute_id`	Struna	Przestarzałe. Identyfikator zasobu obliczeniowego do użycia dla tego obiektu docelowego.
`default`	Wartość logiczna	Czy ten element jest domyślnym obiektem docelowym?
`git`	Mapa	Ustawienia kontroli wersji usługi Git dla miejsca docelowego. Zobacz git.
`mode`	Struna	Tryb wdrażania dla obiektu docelowego. Prawidłowe wartości to `development` lub `production`. Zobacz Tryby wdrażania zasobów pakietu usługi Databricks.
`permissions`	Kolejność	Uprawnienia do wdrażania i uruchamiania pakietu w obiekcie docelowym. Zobacz uprawnienia.
`presets`	Mapa	Ustawienia wstępne wdrożenia dla obiektu docelowego. Zobacz ustawienia wstępne .
`resources`	Mapa	Definicje zasobów dla obiektu docelowego. Zobacz zasoby.
`run_as`	Mapa	Tożsamość używana do uruchamiania pakietu. Zobacz run_as i Określ tożsamość przebiegu dla przepływu pracy pakietów zasobów usługi Databricks.
`sync`	Mapa	Lokalne ścieżki do synchronizacji z docelową przestrzenią roboczą podczas uruchamiania lub wdrażania pakietu. Zobacz sync.
`variables`	Mapa	Definicje zmiennych niestandardowych dla obiektu docelowego. Zobacz zmienne , substytucje oraz zmienne w pakietach zasobów usługi Databricks.
`workspace`	Mapa	Obszar roboczy usługi Databricks dla obiektu docelowego. obszaru roboczego

Zmiennych

Mapa, która definiuje zmienne niestandardowe dla pakietu, gdzie każdy klucz jest nazwą zmiennej, a wartość jest mapą, która definiuje zmienną. Zobacz Podstawienia i zmienne w pakietach zasobów Databricks.

Klucz	Typ	Opis
nazwa-zmiennej	Mapa	Definicja zmiennej. Zobacz nazwa-zmiennej.

nazwa-zmiennej

Każda definicja zmiennej ma następujące atrybuty:

Klucz	Typ	Opis
`description`	Struna	Opis zmiennej.
`lookup`	Struna	Nazwa `alert`, `cluster_policy`, `cluster`, `dashboard`, `instance_pool`, `job`, `metastore`, `pipeline`, `query`, `service_principal`lub obiektu `warehouse`, dla którego ma pobrać identyfikator.
`type`	Struna	Typ zmiennej. Prawidłowe wartości to `complex`.

obszar roboczy

Definiuje obszar roboczy usługi Databricks dla pakietu. Zobacz obszar roboczy.

Klucz	Typ	Opis
`artifact_path`	Struna	Ścieżka artefaktu do użycia w obszarze roboczym zarówno dla wdrożeń, jak i przebiegów przepływu pracy
`auth_type`	Struna	Typ uwierzytelniania.
`azure_client_id`	Struna	Identyfikator klienta platformy Azure.
`azure_environment`	Struna	Środowisko platformy Azure.
`azure_login_app_id`	Struna	Identyfikator aplikacji logowania platformy Azure.
`azure_tenant_id`	Struna	Identyfikator dzierżawy platformy Azure.
`azure_use_msi`	Wartość logiczna	Czy należy używać tożsamości zarządzanej w usłudze Azure?
`azure_workspace_resource_id`	Struna	Identyfikator zasobu obszaru roboczego platformy Azure.
`client_id`	Struna	Identyfikator klienta dla obszaru roboczego.
`file_path`	Struna	Ścieżka pliku w obszarze roboczym do użycia zarówno dla wdrożeń, jak i uruchomień przepływu pracy.
`google_service_account`	Struna	Nazwa konta usługi Google.
`host`	Struna	Adres URL hosta platformy obszaru roboczego Databricks.
`profile`	Struna	Nazwa profilu obszaru roboczego usługi Databricks.
`resource_path`	Struna	Ścieżka zasobu obszaru roboczego.
`root_path`	Struna	Ścieżka główna obszaru roboczego usługi Databricks.
`state_path`	Struna	Ścieżka stanu obszaru roboczego.

Udostępnij za pośrednictwem

Dokumentacja konfiguracji

artefakt

Artefakty

Przykład

plik_artefaktu

pakiet

Wdrożenie

eksperymentalny

Git

dotacja

Przykład

zamek

pozwolenie

Uprawnienia

Przykład

Ustawień

zasoby

uruchom_jako

synchronizować

cel

Zmiennych

nazwa-zmiennej

obszar roboczy

Opinia

Dodatkowe zasoby