Sdílet prostřednictvím


Spusťte soubor v clusteru nebo spusťte soubor či poznámkový blok jako úlohu v Azure Databricks pomocí rozšíření pro Databricks ve Visual Studio Code

Rozšíření Databricks pro Visual Studio Code umožňuje spouštět váš kód Pythonu na clusteru nebo spouštět kód v Pythonu, R, Scala, SQL či poznámkovém bloku jako úlohu v Azure Databricks.

Tyto informace předpokládají, že jste už nainstalovali a nastavili rozšíření Databricks pro Visual Studio Code. Viz Instalace rozšíření Databricks pro Visual Studio Code.

Spuštění souboru Pythonu v clusteru

Poznámka:

Tato funkce není k dispozici při použití bezserverového výpočetního prostředí.

Spuštění souboru Pythonu v clusteru Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s příponou a otevřeným projektem:

  1. Otevřete soubor Pythonu, který chcete spustit v clusteru.

  2. Proveďte některou z následujících akcí:

    • V záhlaví editoru souborů klikněte na ikonu Spustit v Databricks a potom klikněte na Nahrát a spustit soubor.

      Nahrání a spuštění souboru z ikony

    • V zobrazení Průzkumníka (Zobrazit > Průzkumníka), klikněte pravým tlačítkem myši na soubor a pak v místní nabídce vyberte Spustit v Databricks> nebo Nahrát a Spustit soubor.

      Nahrání a spuštění souboru z místní nabídky

Soubor běží v clusteru a výstup je k dispozici v konzole ladění (Zobrazit > konzoli ladění).

Spuštění souboru Pythonu jako úlohy

Spuštění souboru Pythonu jako úlohy Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code s příponou a otevřeným projektem:

  1. Otevřete soubor Pythonu, který chcete spustit jako úlohu.

  2. Proveďte některou z následujících akcí:

    • V záhlaví editoru souborů klikněte na ikonu Spustit v Databricks a potom klikněte na Spustit soubor jako pracovní postup.

      Spustit soubor jako pracovní postup z ikony

    • V zobrazení Průzkumníka (Zobrazit > Průzkumníka) klikněte pravým tlačítkem myši na soubor a v místní nabídce vyberte Spustit na Databricks>Spustit soubor jako pracovní postup.

      Spuštění souboru jako pracovního postupu z místní nabídky

Zobrazí se nová karta editoru s názvem Spuštění úlohy Databricks. Soubor se spustí jako úloha v pracovním prostoru a veškerý výstup se vytiskne do oblasti Výstup nové karty editoru.

Pokud chcete zobrazit informace o spuštění úlohy, klikněte na odkaz ID spuštění úlohy na nové kartě editoru spuštění úlohy v Databricks. Otevře se váš pracovní prostor a podrobnosti o spuštění úlohy se zobrazí ve vašem pracovním prostoru.

Spusťte poznámkový blok Pythonu, R, Scaly nebo SQL jako úlohu.

Chcete-li spustit poznámkový blok jako úlohu na Azure Databricks pomocí rozšíření Databricks pro Visual Studio Code, otevřete rozšíření i váš projekt:

  1. Otevřete poznámkový blok, který chcete spustit jako úlohu.

    Návod

    Pokud chcete převést soubor Pythonu, R, Scaly nebo SQL na poznámkový blok Azure Databricks, přidejte komentář # Databricks notebook source na začátek souboru a před každou buňku přidejte komentář # COMMAND ---------- . Další informace najdete v tématu Import souboru a jeho převod do poznámkového bloku.

    Soubor kódu Pythonu formátovaný jako poznámkový blok Databricks1

  2. Proveďte některou z následujících akcí:

    • V záhlaví editoru souborů poznámkového bloku klikněte na ikonu Spustit v Databricks a potom klikněte na Spustit soubor jako pracovní postup.

    Poznámka:

    Pokud možnost Spustit v Databricks jako pracovní postup není dostupná, přečtěte si téma Vytvoření vlastní konfigurace spuštění.

    • V zobrazení Průzkumníka (Zobrazit Průzkumníka>) klikněte pravým tlačítkem myši na soubor poznámkového bloku a v místní nabídce vyberte Spustit na Databricks>Spustit soubor jako pracovní postup.

Zobrazí se nová karta editoru s názvem Spuštění úlohy Databricks. Poznámkový blok běží jako úloha v pracovním prostoru. Poznámkový blok a jeho výstup se zobrazí v oblasti výstupu na nové kartě editoru.

Pokud chcete zobrazit informace o spuštění úlohy, klikněte na odkaz Task run ID na kartě Databricks Job Run editoru. Otevře se váš pracovní prostor a podrobnosti o spuštění úlohy se zobrazí v pracovním prostoru.

Vytvoření vlastní konfigurace spuštění

Vlastní konfigurace spuštění pro rozšíření Databricks pro Visual Studio Code umožňuje předat do úlohy nebo poznámkového bloku vlastní argumenty nebo vytvořit různá nastavení spuštění pro různé soubory.

Chcete-li vytvořit vlastní konfiguraci spuštění, klepněte na tlačítko Spustit > přidat konfiguraci z hlavní nabídky v editoru Visual Studio Code. Pak vyberte buď Databricks pro konfiguraci spuštění založenou na clusteru, nebo Databricks: Pracovní postup pro konfiguraci spuštění založenou na úlohách.

Například následující vlastní konfigurace spuštění upraví Spustit soubor jako pracovní postup tak, aby předala --prod argument úloze:

{
  "version": "0.2.0",
  "configurations": [
    {
      "type": "databricks-workflow",
      "request": "launch",
      "name": "Run on Databricks as Workflow",
      "program": "${file}",
      "parameters": {},
      "args": ["--prod"]
    }
  ]
}

Tip

Přidejte "databricks": true do "type": "python" konfigurace, pokud chcete použít konfiguraci Pythonu, ale využijte ověřování Databricks Connect, které je součástí nastavení rozšíření.

Pomocí vlastních konfigurací spuštění můžete také předat argumenty příkazového řádku a spustit kód pouhým stisknutím klávesy F5. Další informace najdete v dokumentaci editoru Visual Studio Code, v tématu Konfigurace spuštění.