Konfigurowanie projektu usługi Databricks przy użyciu rozszerzenia usługi Databricks dla programu Visual Studio Code
Rozszerzenie Databricks dla programu Visual Studio Code oferuje widok Configuration w panelu rozszerzenia, który umożliwia łatwe konfigurowanie i aktualizowanie ustawień projektu usługi Databricks. Te funkcje obejmują selektor wdrożenia docelowego obszaru roboczego, łatwą konfigurację uwierzytelniania i obliczeń, synchronizację folderów obszaru roboczego i proste kroki aktywowania środowiska wirtualnego języka Python niezbędnego do debugowania.
Widok Konfiguracja w rozszerzeniu usługi Databricks dla programu Visual Studio Code jest dostępny po utworzeniu lub zmigrowaniu projektu do projektu usługi Databricks. Zobacz Utwórz nowy projekt usługi Databricks.
Uwaga
W wcześniejszych wersjach rozszerzenia Databricks dla programu Visual Studio Code ustawienia konfiguracji były definiowane w pliku JSON projektu, a zmienne środowiskowe były ustawiane w terminalu. W wersji wydania konfiguracja projektu i środowiska znajduje się w plikach databricks.yml
i databricks.env
.
Jeśli Twój projekt jest Databricks Asset Bundle, UI rozszerzenia Databricks udostępnia również Eksplorator zasobów pakietu i Widok zmiennych pakietu do zarządzania zasobami i zmiennymi pakietów. Zobacz funkcje rozszerzenia pakietów zasobów Databricks.
Zmienianie docelowego obszaru roboczego wdrożenia
Aby wybrać lub przełączyć cel wdrożenia dla projektu usługi Databricks (na przykład aby przełączyć się z docelowego dev
na docelowy prod
):
W widoku Configuration panelu rozszerzenia usługi Databricks kliknij ikonę koła zębatego (Wybierz docelowy pakiet zasobów usługi Databricks) skojarzony z Celem.
W palecie poleceń , wybierz żądany cel wdrożenia.
Po skonfigurowaniu celu zostanie wyświetlony host i tryb wdrożenia. Aby uzyskać informacje na temat trybów wdrażania pakietów zasobów usługi Databricks, zobacz Tryby wdrażania pakietu zasobów usługi Databricks.
Host obszaru roboczego można zmienić, modyfikując ustawienie docelowe workspace
w databricks.yml
pliku konfiguracji skojarzonym z projektem. Zobacz cele.
Uwaga
Następujące rozszerzenie usługi Databricks dla funkcji programu Visual Studio Code jest dostępne tylko wtedy, gdy jest opracowywany docelowy tryb wdrażania:
- Używanie dołączonego klastra programistycznego na potrzeby zadań pakietu
- Synchronizowanie plików folderów obszaru roboczego
- Wybieranie interaktywnego klastra programistycznego
Konfigurowanie profilu usługi Databricks dla projektu
Podczas tworzenia projektu usługi Databricks lub konwertowania projektu jako projektu usługi Databricks należy skonfigurować profil zawierający ustawienia uwierzytelniania używane do nawiązywania połączenia z usługą Databricks. Jeśli chcesz zmienić używany profil uwierzytelniania, kliknij ikonę koła zębatego skojarzonego z AuthType w widoku Konfiguracja .
Aby uzyskać więcej informacji na temat rozszerzenia usługi Databricks na potrzeby uwierzytelniania programu Visual Studio Code, zobacz Konfigurowanie autoryzacji dla rozszerzenia usługi Databricks dla programu Visual Studio Code.
Wybieranie zasobów obliczeniowych na potrzeby uruchamiania kodu i zadań
Korzystając z rozszerzenia usługi Databricks dla programu Visual Studio Code, możesz wybrać pozycję bezserwerową, wybrać istniejący klaster usługi Azure Databricks lub utworzyć nowy klaster usługi Azure Databricks na potrzeby uruchamiania kodu i zadań. Po nawiązaniu połączenia z obliczeniami wyświetlany jest identyfikator klastra, wersja środowiska Databricks Runtime, twórca, stan i tryb dostępu. Możesz również uruchomić i zatrzymać klaster, a następnie przejść bezpośrednio do szczegółów strony klastra.
Napiwek
Jeśli nie chcesz czekać na uruchomienie klastra zadań, zaznacz Zastąp klaster zadań w pakiecie tuż poniżej wyboru klastra, aby użyć wybranego klastra do uruchamiania zadań pakietu w trybie deweloperskim. Nie jest to dostępne, jeśli używasz bezserwerowych obliczeń.
Korzystaj z rozwiązań bezserwerowych
Przetwarzanie bezserwerowe jest zarządzane przez usługę Azure Databricks. Po uruchomieniu obciążeń na obliczeniach bezserwerowych usługa Azure Databricks automatycznie przydziela niezbędne zasoby obliczeniowe i zarządza nimi.
W widoku Configuration obok Klastra, kliknij pozycję Wybierz klaster lub ikonę koła zębatego (Konfiguracja klastra).
W palety poleceńwybierz pozycję Bezserwerowa.
Korzystanie z istniejącego klastra
Jeśli masz istniejący klaster usługi Azure Databricks, którego chcesz użyć:
W widoku Konfiguracja, obok Klaster, kliknij pozycję Wybierz klaster lub ikonę koła zębatego (Skonfiguruj klaster).
W Palecie Poleceńwybierz klaster, którego chcesz użyć.
Tworzenie nowego klastra
Jeśli nie masz istniejącego klastra usługi Azure Databricks lub chcesz utworzyć nowy klaster:
W widoku Konfiguracja obok Klaster kliknij ikonę koła zębatego (Konfiguruj klaster).
W palecie poleceń kliknij pozycję Utwórz nowy klaster.
Po wyświetleniu monitu o otwarcie zewnętrznej witryny internetowej (obszaru roboczego usługi Azure Databricks) kliknij przycisk Otwórz.
Jeśli zostanie wyświetlony monit, zaloguj się do obszaru roboczego usługi Azure Databricks.
Postępuj zgodnie z instrukcjami, aby utworzyć klaster.
Uwaga
Usługa Databricks zaleca utworzenie klastra Personal Compute. Dzięki temu można natychmiast rozpocząć uruchamianie obciążeń, minimalizując obciążenie związane z zarządzaniem obliczeniami.
Po utworzeniu i uruchomieniu klastra wróć do programu Visual Studio Code.
W widoku Konfiguracja, obok Klaster, kliknij ikonę konfiguracji (Konfiguruj klaster).
W Palecie poleceń kliknij klaster, który chcesz użyć.
Zsynchronizuj folder obszaru roboczego z Databricks
Zdalny folder obszaru roboczego usługi Databricks skojarzony z projektem można zsynchronizować, klikając ikonę synchronizacji (Rozpocznij synchronizację) skojarzoną z folderem zdalnym w widoku konfiguracji panelu rozszerzenia usługi Databricks.
Uwaga
Rozszerzenie Databricks dla programu Visual Studio Code działa tylko z katalogami obszarów roboczych, które ono tworzy. Nie można użyć istniejącego katalogu obszaru roboczego w projekcie, chyba że został utworzony przez rozszerzenie.
Aby przejść do widoku obszaru roboczego w usłudze Databricks, kliknij ikonę linku zewnętrznego (Otwórz link zewnętrznie) skojarzoną z Folderem Zdalnym.
Rozszerzenie określa folder obszaru roboczego usługi Azure Databricks do użycia na podstawie ustawienia file_path
w mapowaniu konfiguracji skojarzonego pakietu zasobów usługi Databricks projektu. Zobacz obszar roboczy.
Uwaga
Rozszerzenie usługi Databricks dla programu Visual Studio Code wykonuje tylko jednokierunkową automatyczną synchronizację zmian plików z lokalnego projektu programu Visual Studio Code z powiązanym folderem obszaru roboczego w zdalnym obszarze roboczym usługi Azure Databricks. Pliki w tym zdalnym katalogu obszaru roboczego mają być przejściowe. Nie inicjuj zmian tych plików z obszaru roboczego zdalnego, ponieważ te zmiany nie zostaną zsynchronizowane z powrotem do projektu lokalnego.
Aby uzyskać szczegółowe informacje o użyciu funkcji synchronizacji katalogu obszaru roboczego dla wcześniejszych wersji rozszerzenia usługi Databricks dla programu Visual Studio Code, zobacz
Konfigurowanie środowiska języka Python i usługi Databricks Connect
Sekcja Środowisko języka Python w widoku Konfiguracja umożliwia łatwą konfigurację wirtualnego środowiska deweloperskiego języka Python i instalację programu Databricks Connect na potrzeby uruchamiania i debugowania kodu i komórek notesu. Środowiska wirtualne języka Python zapewniają, że projekt korzysta z zgodnych wersji pakietów python i Python (w tym przypadku pakietu Databricks Connect).
Aby skonfigurować wirtualne środowisko Python dla projektu, w widoku Konfiguracji panelu rozszerzenia:
- Kliknij czerwony element Aktywuj środowisko wirtualne w obszarze Środowisko języka Python.
- W palecie poleceń wybierz pozycję Venv lub Conda.
- Wybierz zależności, które chcesz zainstalować, jeśli istnieją.
Aby zmienić środowiska, kliknij ikonę koła zębatego (Zmień wirtualne środowisko) skojarzone z Aktywnym Środowiskiem.
Aby uzyskać informacje na temat instalowania programu Databricks Connect, który umożliwia uruchamianie i debugowanie kodu i notesów w programie Visual Studio Code, zobacz Debugowanie kodu przy użyciu programu Databricks Connect dla rozszerzenia usługi Databricks dla programu Visual Studio Code.