Spusťte soubor v clusteru nebo spusťte soubor či poznámkový blok jako úlohu v Azure Databricks pomocí rozšíření pro Databricks ve Visual Studio Code
Rozšíření Databricks pro Visual Studio Code umožňuje spouštět váš kód Pythonu na clusteru nebo spouštět kód v Pythonu, R, Scala, SQL či poznámkovém bloku jako úlohu v Azure Databricks.
Tyto informace předpokládají, že jste už nainstalovali a nastavili rozšíření Databricks pro Visual Studio Code. Viz Instalace rozšíření Databricks pro Visual Studio Code.
Poznámka:
K ladění kódu nebo poznámkových bloků v editoru Visual Studio Code použijte Databricks Connect. Podívejte se na odlaďování kódu s využitím Databricks Connect pro rozšíření Databricks ve Visual Studio Code a na spouštění a ladění buněk poznámkového bloku pomocí Databricks Connect za použití rozšíření Databricks pro Visual Studio Code.
Spuštění souboru Pythonu v clusteru
Poznámka:
Tato funkce není k dispozici při použití bezserverového výpočetního prostředí.
Spuštění souboru Pythonu v clusteru Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s příponou a otevřeným projektem:
Otevřete soubor Pythonu, který chcete spustit v clusteru.
Proveďte některou z následujících akcí:
V záhlaví editoru souborů klikněte na ikonu Spustit v Databricks a potom klikněte na Nahrát a spustit soubor.
V zobrazení Průzkumníka (Zobrazit > Průzkumníka), klikněte pravým tlačítkem myši na soubor a pak v místní nabídce vyberte Spustit v Databricks> nebo Nahrát a Spustit soubor.
Soubor běží v clusteru a výstup je k dispozici v konzole ladění (Zobrazit > konzoli ladění).
Spuštění souboru Pythonu jako úlohy
Spuštění souboru Pythonu jako úlohy Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s příponou a otevřeným projektem:
Otevřete soubor Pythonu, který chcete spustit jako úlohu.
Proveďte některou z následujících akcí:
V záhlaví editoru souborů klikněte na ikonu Spustit v Databricks a potom klikněte na Spustit soubor jako pracovní postup.
V zobrazení Průzkumníka (Zobrazit > Průzkumníka) klikněte pravým tlačítkem myši na soubor a v místní nabídce vyberte Spustit na Databricks>Spustit soubor jako pracovní postup.
Zobrazí se nová karta editoru s názvem Spuštění úlohy Databricks. Soubor se spustí jako úloha v pracovním prostoru a veškerý výstup se vytiskne do oblasti Výstup nové karty editoru.
Pokud chcete zobrazit informace o spuštění úlohy, klikněte na odkaz ID spuštění úlohy na nové kartě editoru spuštění úlohy v Databricks. Otevře se váš pracovní prostor a podrobnosti o spuštění úlohy se zobrazí ve vašem pracovním prostoru.
Spusťte poznámkový blok Pythonu, R, Scaly nebo SQL jako úlohu.
Chcete-li spustit poznámkový blok jako úlohu na Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code, otevřete rozšíření i váš projekt:
Otevřete poznámkový blok, který chcete spustit jako úlohu.
Návod
Pokud chcete převést soubor Pythonu, R, Scaly nebo SQL na poznámkový blok Azure Databricks, přidejte komentář
# Databricks notebook source
na začátek souboru a před každou buňku přidejte komentář# COMMAND ----------
. Další informace najdete v tématu Import souboru a jeho převod do poznámkového bloku.Proveďte některou z následujících akcí:
- V záhlaví editoru souborů poznámkového bloku klikněte na ikonu Spustit v Databricks a potom klikněte na Spustit soubor jako pracovní postup.
Poznámka:
Pokud možnost Spustit v Databricks jako pracovní postup není dostupná, přečtěte si téma Vytvoření vlastní konfigurace spuštění.
- V zobrazení Průzkumníka (Zobrazit Průzkumníka>) klikněte pravým tlačítkem myši na soubor poznámkového bloku a v místní nabídce vyberte Spustit na Databricks>Spustit soubor jako pracovní postup.
Zobrazí se nová karta editoru s názvem Spuštění úlohy Databricks. Poznámkový blok běží jako úloha v pracovním prostoru. Poznámkový blok a jeho výstup se zobrazí v oblasti výstupu na nové kartě editoru.
Pokud chcete zobrazit informace o spuštění úlohy, klikněte na odkaz Task run ID na kartě Databricks Job Run editoru. Otevře se váš pracovní prostor a podrobnosti o spuštění úlohy se zobrazí v pracovním prostoru.
Vytvoření vlastní konfigurace spuštění
Vlastní konfigurace spuštění pro rozšíření Databricks pro Visual Studio Code umožňuje předat do úlohy nebo poznámkového bloku vlastní argumenty nebo vytvořit různá nastavení spuštění pro různé soubory.
Chcete-li vytvořit vlastní konfiguraci spuštění, klepněte na tlačítko Spustit > přidat konfiguraci z hlavní nabídky v editoru Visual Studio Code. Pak vyberte buď Databricks pro konfiguraci spuštění založenou na clusteru, nebo Databricks: Pracovní postup pro konfiguraci spuštění založenou na úlohách.
Například následující vlastní konfigurace spuštění upraví Spustit soubor jako pracovní postup tak, aby předala --prod
argument úloze:
{
"version": "0.2.0",
"configurations": [
{
"type": "databricks-workflow",
"request": "launch",
"name": "Run on Databricks as Workflow",
"program": "${file}",
"parameters": {},
"args": ["--prod"]
}
]
}
Tip
Přidejte "databricks": true
do "type": "python"
konfigurace, pokud chcete použít konfiguraci Pythonu, ale využijte ověřování Databricks Connect, které je součástí nastavení rozšíření.
Pomocí vlastních konfigurací spuštění můžete také předat argumenty příkazového řádku a spustit kód pouhým stisknutím klávesy F5. Další informace najdete v dokumentaci editoru Visual Studio Code, v tématu Konfigurace spuštění.