Поделиться через


локальные средства разработки

Databricks предоставляет экосистему средств для разработки приложений и решений, которые интегрируются с Azure Databricks и программно управляют ресурсами и данными Databricks.

В этой статье представлен обзор этих средств и рекомендаций по лучшим средствам для распространенных сценариев разработчика.

Какие средства предоставляют Databricks для локальной разработки?

В следующей таблице приведен список средств разработчика, предоставляемых Databricks.

Инструмент Описание
Проверка подлинности и авторизация Настройте проверку подлинности и авторизацию для средств, сценариев и приложений для работы с Azure Databricks.
Databricks Connect Подключитесь к Azure Databricks с помощью популярных интегрированных сред разработки (IDEs), таких как PyCharm, IntelliJ IDEA, Eclipse, RStudio и JupyterLab.
Если вы используете Visual Studio Code, Databricks рекомендует расширение Databricks для Visual Studio Code, созданное на основе Databricks Connect, так как предоставляет дополнительные функции для упрощения настройки.
Расширение Databricks для Visual Studio Code Подключитесь к удаленным рабочим областям Azure Databricks из интегрированной среды разработки Visual Studio Code (IDE).
Плагин PyCharm Databricks Настройте подключение к удаленной рабочей области Databricks и запустите файлы в кластерах Databricks из PyCharm. Этот подключаемый модуль разработан и предоставляется JetBrains в партнерстве с Databricks.
SDK Databricks Автоматизация Azure Databricks из библиотек кода, написанных для популярных языков, таких как Python, Java, Go и R. Вместо отправки вызовов REST API непосредственно с помощью curl/Postman можно использовать пакет SDK для взаимодействия с Databricks с помощью выбранного языка программирования. Пакеты SDK Databricks поддерживают полный REST API и предоставляют другие функции, включая единую проверку подлинности и разбиение на страницы, что упрощает их использование и расширение для покрытия многих сценариев.
Драйверы и средства SQL Подключитесь к Azure Databricks для выполнения команд и скриптов SQL, программного взаимодействия с Azure Databricks и интеграции функций SQL Azure Databricks в приложения, написанные на популярных языках, таких как Python, Go, JavaScript и TypeScript.
CLI Databricks Доступ к функциям Azure Databricks с помощью интерфейса командной строки Databricks (CLI). Интерфейс командной строки упаковывает REST API Databricks, поэтому вместо отправки вызовов REST API непосредственно с помощью curl или Postman можно использовать интерфейс командной строки Databricks для взаимодействия с Databricks.
Пакеты активов Databricks Реализуйте передовые практики отраслевого стандарта по разработке, тестированию и развертыванию (CI/CD) для данных и проектов ИИ в Azure Databricks с помощью Databricks Asset Bundles (DAB).
Провайдер Databricks Terraform и Terraform CDKTF для Databricks Подготовка инфраструктуры и ресурсов Azure Databricks с помощью Terraform.
Средства CI/CD Интеграция популярных систем CI/CD и платформ, таких как GitHub Actions, Jenkins и Apache Airflow.

Совет

Вы также можете подключить множество дополнительных популярных сторонних средств к кластерам и хранилищам SQL для доступа к данным в Azure Databricks. Ознакомьтесь с партнерами по технологиям.

Какой инструмент разработчика следует использовать?

В следующей таблице приведены рекомендации по инструменту Databricks для распространенных сценариев разработчика.

Инструмент Рекомендация по использованию
Расширение Databricks для Visual Studio Code
Плагин PyCharm Databricks
Для других IDE используйте интерфейс командной строки Databricks с Databricks Connect
  • Интерактивная разработка и отладка из локальной интегрированной среды разработки
Databricks CLI
  • Прямое взаимодействие с Databricks из командной строки
  • Программирование скриптов оболочки
  • Экспериментирование
  • Вызов REST API напрямую
  • Управление профилями локальной проверки подлинности
  • Синхронизация кода из интегрированной среды разработки с рабочей областью Databricks
Наборы активов Databricks (функция CLI)
  • Управление рабочими процессами и развертывание проектов в Databricks
  • Применение лучших практик CI/CD
  • Совместное создание версий, авторство и развертывание ваших ресурсов и активов как единого целого.
  • Поддерживает наиболее распространенные ресурсы
Провайдер Databricks для Terraform
  • Инфраструктура как код, CI/CD
  • Администрирование и создание рабочих областей, каталогов, хранилищ метаданных и применение разрешений
  • Гарантируйте переносимость среды и восстановление после аварий
  • Многие поддерживаемые ресурсы
Databricks Python SDK
Databricks Java SDK
Databricks Go SDK
Databricks R SDK
  • Разработка приложений
  • Интеграция с существующими системами развертывания
  • Создайте пользовательские рабочие процессы Databricks и новые веб-сервисы
REST API Databricks
  • Автоматизация процессов, в которых пакет SDK на предпочитаемом языке программирования недоступен
  • Только расширенные сценарии
  • Почти все ресурсы Databricks доступны