Функции расширения пакетов ресурсов Databricks

Статья
03/06/2025

Расширение Databricks для Visual Studio Code предоставляет дополнительные возможности в Visual Studio Code, которые позволяют легко определять, развертывать и запускать пакеты ресурсов Databricks для применения рекомендаций CI/CD к заданиям Azure Databricks, конвейерам DLT и MLOps Stacks. См. раздел "Что такое пакеты ресурсов Databricks?".

Чтобы установить расширение Databricks для Visual Studio Code, см . раздел "Установка расширения Databricks для Visual Studio Code".

Поддержка пакетов ресурсов Databricks в проектах

Расширение Databricks для Visual Studio Code добавляет следующие функции для проектов наборов ресурсов Databricks:

Простая проверка подлинности и настройка пакетов ресурсов Databricks с помощью пользовательского интерфейса Visual Studio Code, включая выбор профиля AuthType . См. настройка авторизации расширения Databricks для Visual Studio Code.
Селектор целевой среды на панели расширения Databricks для быстрого переключения между целевыми средами пакета. См. Изменение целевой рабочей области развертывания.
Опция Override Jobs cluster в пакете на панели расширения позволяет легко переопределить кластер.
Представление Bundles Resource Explorer, которое позволяет просматривать ваши ресурсы пакетов с помощью интерфейса Visual Studio Code, развертывать локальные ресурсы пакета Databricks в удаленной рабочей области Azure Databricks одним щелчком и переходить непосредственно к развернутым ресурсам в рабочей области из Visual Studio Code. См. Проводник ресурсов пакета.
Представление Переменных Пакетов, которое позволяет просматривать и изменять переменные пакетов с помощью интерфейса Visual Studio Code. См. Представление переменных пакета.

Обозреватель ресурсов пакета

Обозреватель ресурсов пакета в расширении Databricks для Visual Studio Code использует определения ресурсов в конфигурации пакета проекта для отображения ресурсов, включая наборы данных конвейера и их схемы. Он также позволяет развертывать и запускать ресурсы, проверять и выполнять частичные обновления конвейеров, просматривать события выполнения конвейера и диагностику и переходить к ресурсам в удаленной рабочей области Azure Databricks. Сведения о ресурсах конфигурации пакета см. в разделе "Ресурсы".

Например, учитывая простое определение задания:

resources:
  jobs:
    my-notebook-job:
      name: 'My Notebook Job'
      tasks:
        - task_key: notebook-task
          existing_cluster_id: 1234-567890-abcde123
          notebook_task:
            notebook_path: notebooks/my-notebook.py

В просмотре обозревателя ресурсов пакета в расширении отображается ресурс задания для ноутбука:

Обозреватель ресурсов пакета

Развертывание и запуск задания

Чтобы развернуть пакет, щелкните значок облака (развернуть пакет).

Развертывание пакета

Чтобы запустить задание, в представлении обозревателя ресурсов пакета выберите имя задания, которое является заданием "Моя записная книжка" в этом примере. Затем щелкните значок воспроизведения (разверните пакет и запустите ресурс).

Развертывание пакета и запуск ресурса

Чтобы просмотреть выполняемое задание, в представлении Обозревателя Ресурсов Пакета разверните имя задания, нажмите Запуск статуса, а затем щелкните значок (Открыть ссылку во внешнем приложении).

Открыть ссылку на задание в новом окне

Проверка и диагностика проблем конвейера

Для конвейера можно инициировать проверку и частичное обновление, выбрав конвейер, а затем нажав на значок (Развернуть пакет и проверить конвейер). Отображаются события выполнения, и любые сбои можно диагностировать в панели PROBLEMS Visual Studio Code.

Развернуть пакет и проверить конвейер

события выполнения конвейера

Представление переменных пакета

Представление переменных пакета в расширении Databricks для Visual Studio Code отображает все пользовательские переменные и связанные параметры, определенные в конфигурации пакета. Можно также определить переменные непосредственно с помощью представления переменных Bundles. Эти значения переопределяют те, которые задаются в файлах конфигурации пакета. Сведения о пользовательских переменных см. в разделе "Пользовательские переменные".

Например, Просмотр переменных пакета в расширении будет отображать следующее:

Представление переменных пакета

Для переменной my_custom_var , определенной в этой конфигурации пакета:

variables:
  my_custom_var:
    description: 'Max workers'
    default: '4'

resources:
  jobs:
    my_job:
      name: my_job

      tasks:
        - task_key: notebook_task
          job_cluster_key: job_cluster
          notebook_task:
            notebook_path: ../src/notebook.ipynb

      job_clusters:
        - job_cluster_key: job_cluster
          new_cluster:
            spark_version: 13.3.x-scala2.12
            node_type_id: i3.xlarge
            autoscale:
              min_workers: 1
              max_workers: ${var.my_custom_var}

Поделиться через

Функции расширения пакетов ресурсов Databricks

Поддержка пакетов ресурсов Databricks в проектах

Обозреватель ресурсов пакета

Развертывание и запуск задания

Проверка и диагностика проблем конвейера

Представление переменных пакета

Обратная связь

Дополнительные ресурсы