Udostępnij za pośrednictwem


Funkcje rozszerzenia pakietu zasobów usługi Databricks

Rozszerzenie Databricks dla programu Visual Studio Code udostępnia dodatkowe funkcje w programie Visual Studio Code, które umożliwiają łatwe definiowanie, wdrażanie i uruchamianie pakietów zasobów Databricks w celu zastosowania najlepszych praktyk CI/CD do zadań usługi Azure Databricks, potoków DLT i stosów MLOps. Zobacz Co to są pakiety zasobów usługi Databricks?.

Aby zainstalować rozszerzenie usługi Databricks dla programu Visual Studio Code, zobacz Instalowanie rozszerzenia usługi Databricks dla programu Visual Studio Code.

Wsparcie pakietów zasobów Databricks w projektach

Rozszerzenie usługi Databricks dla programu Visual Studio Code dodaje następujące funkcje dla projektów pakietu zasobów usługi Databricks:

  • Łatwe uwierzytelnianie i konfiguracja pakietów zasobów Databricks za pośrednictwem interfejsu użytkownika programu Visual Studio Code, łącznie z wyborem profilu AuthType. Zobacz Konfigurowanie autoryzacji dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
  • Selektor docelowy w panelu rozszerzenia usługi Databricks, aby szybko przełączać się między środowiskami docelowymi pakietu. Zajrzyj do Zmienianie docelowego obszaru roboczego wdrożenia.
  • Opcja Zastąp klaster w pakiecie w panelu rozszerzenia umożliwia łatwe zastępowanie klastra.
  • Eksplorator zasobów pakietu, który umożliwia przeglądanie zasobów pakietu za pomocą interfejsu użytkownika Visual Studio Code, wdrażanie lokalnych zasobów pakietu assetów Databricks do zdalnego obszaru roboczego Azure Databricks jednym kliknięciem oraz przechodzenie bezpośrednio do wdrożonych zasobów w obszarze roboczym z Visual Studio Code. Zobacz Bundle Resource Explorer (Eksplorator zasobów pakietu).
  • Widok zmiennych pakietu, który umożliwia przeglądanie i edytowanie zmiennych pakietu przy użyciu interfejsu użytkownika programu Visual Studio Code. Zobacz Widok zmiennych pakietu.

Eksplorator zasobów pakietu

Widok Bundle Resource Explorer w ramach rozszerzenia Databricks dla programu Visual Studio Code korzysta z definicji zasobów zawartych w konfiguracji pakietu projektu w celu wyświetlania zasobów, takich jak zbiory danych potoków oraz ich schematy. Umożliwia również wdrażanie i uruchamianie zasobów, weryfikowanie i dokonywanie częściowych aktualizacji potoków, wyświetlanie zdarzeń uruchomieniowych potoków i diagnostyki oraz przechodzenie do zasobów w zdalnym obszarze roboczym usługi Azure Databricks. Aby uzyskać informacje o zasobach konfiguracji pakietu, zobacz zasoby.

Na przykład biorąc pod uwagę prostą definicję zadania:

resources:
  jobs:
    my-notebook-job:
      name: 'My Notebook Job'
      tasks:
        - task_key: notebook-task
          existing_cluster_id: 1234-567890-abcde123
          notebook_task:
            notebook_path: notebooks/my-notebook.py

Eksplorator zasobów pakietu w rozszerzeniu wyświetla zasób zadania zeszytu:

Eksplorator zasobów pakietu

Wdrażanie i uruchamianie zadania

Aby wdrożyć pakiet, kliknij ikonę chmury (wdróż pakiet).

Wdrażanie pakietu

Aby uruchomić zadanie, w widoku Eksplorator zasobów pakietu, wybierz nazwę zadania, czyli My Notebook Job w tym przykładzie. Następnie kliknij ikonę odtwarzania (Wdróż pakiet i uruchom zasób).

Wdrażanie pakietu i uruchamianie zasobu

Aby wyświetlić uruchomione zadanie, w widoku Eksplorator Zasobów Pakietu rozwiń nazwę zadania, kliknij Stan uruchomienia, a następnie kliknij ikonę Otwórz link zewnętrznie.

Otwórz link zadania zewnętrznie

Weryfikowanie i diagnozowanie problemów z potokiem danych

W przypadku potoku można wyzwolić walidację i częściową aktualizację, wybierając potok, a następnie ikonę z napisem (Wdróż pakiet i zweryfikuj potok). Zostaną wyświetlone zdarzenia przebiegu, a wszystkie błędy można zdiagnozować w panelu Problémów programu Visual Studio Code.

Rozmieść pakiet i zweryfikuj potok

Zdarzenia przebiegu potoku

Widok zmiennych pakietu

Widok Zmiennych Pakietu w rozszerzeniu Databricks dla programu Visual Studio Code wyświetla wszelkie zmienne niestandardowe i powiązane ustawienia zdefiniowane w konfiguracji pakietu. Zmienne można również definiować bezpośrednio przy użyciu Widoku Zmiennych Pakietów. Te wartości zastępują te ustawione w plikach konfiguracji pakietu. Aby uzyskać informacje o zmiennych niestandardowych, zobacz Zmienne niestandardowe.

Na przykład widok Widok zmiennych pakietu w rozszerzeniu wyświetli następujące elementy:

Widok zmiennych pakietu

Dla zmiennej my_custom_var zdefiniowanej w tej konfiguracji pakietu:

variables:
  my_custom_var:
    description: 'Max workers'
    default: '4'

resources:
  jobs:
    my_job:
      name: my_job

      tasks:
        - task_key: notebook_task
          job_cluster_key: job_cluster
          notebook_task:
            notebook_path: ../src/notebook.ipynb

      job_clusters:
        - job_cluster_key: job_cluster
          new_cluster:
            spark_version: 13.3.x-scala2.12
            node_type_id: i3.xlarge
            autoscale:
              min_workers: 1
              max_workers: ${var.my_custom_var}