Aracılığıyla paylaş


Visual Studio Code için Databricks uzantısını kullanarak Azure Databricks'te bir kümede veya dosyada veya not defterinde iş olarak dosya çalıştırma

Visual Studio Code için Databricks uzantısı, Python kodunuzu bir kümede veya Python, R, Scala veya SQL kodunuz ya da not defterinizi Azure Databricks'te iş olarak çalıştırmanıza olanak tanır.

Bu bilgiler, Visual Studio Code için Databricks uzantısını zaten yüklediğinizi ve ayarladığınızı varsayar. Bkz . Visual Studio Code için Databricks uzantısını yükleme.

Not

Visual Studio Code'un içinden kod veya not defterlerinde hata ayıklamak için Databricks Connect'i kullanın. Bkz. Visual Studio Code için Databricks uzantısı için Databricks Connect kullanarak kodda hata ayıklama ve Visual Studio Code için Databricks uzantısını kullanarak Databricks Connect ile not defteri hücrelerini çalıştırma ve hatalarını ayıklama.

Kümede Python dosyası çalıştırma

Visual Studio Code için Databricks uzantısını kullanarak azure databricks kümesinde bir Python dosyası çalıştırmak için, uzantı ve projeniz açık:

  1. Kümede çalıştırmak istediğiniz Python dosyasını açın.
  2. Aşağıdakilerden birini yapın:
    • Dosya düzenleyicisinin başlık çubuğunda Databricks'te Çalıştır simgesine ve ardından Karşıya Yükle ve Dosyayı Çalıştır'a tıklayın.

      Dosyasından dosya yükleme ve çalıştırma

    • Gezgini görünümünde (Görünüm > Explorer) dosyaya sağ tıklayın ve bağlam menüsünden Databricks'te Çalıştır'ı, ardından>Dosya Karşıya Yükleme ve Çalıştırma seçin.

      Bağlam menüsünden dosyayı karşıya yükleme ve çalıştırma

Dosya kümede çalışır ve çıkış Hata Ayıklama Konsolu'nda (Hata Ayıklama Konsolunu Görüntüle>) kullanılabilir.

Python dosyasını iş olarak çalıştırma

Visual Studio Code için Databricks uzantısını kullanarak bir Python dosyasını Azure Databricks işi olarak çalıştırmak ve uzantıyı ve projenizi açmak için:

  1. İş olarak çalıştırmak istediğiniz Python dosyasını açın.
  2. Aşağıdakilerden birini yapın:
    • Dosya düzenleyicisinin başlık çubuğunda Databricks'te Çalıştır simgesine ve ardından Dosyayı İş Akışı Olarak Çalıştır'a tıklayın.

      Dosyayı simgesinden iş akışı olarak çalıştır

    • Gezgini görünümünde (Görünüm > Explorer), dosyaya sağ tıklayın ve bağlam menüsünden Databricks'te Çalıştır, ardından Dosyayı İş Akışı Olarak Çalıştır> seçin.

      Bağlam menüsünden dosyayı iş akışı olarak çalıştır

Databricks İş Çalıştırması başlıklı yeni bir düzenleyici sekmesi görüntülenir. Dosya çalışma alanında bir iş olarak çalışır ve tüm çıkışlar yeni düzenleyici sekmesinin Çıkış alanına yazdırılır.

İş çalıştırması hakkındaki bilgileri görüntülemek için yeni Databricks İş Çalıştırması düzenleyicisi sekmesinde Görev çalıştırma kimliği bağlantısına tıklayın. Çalışma alanınız açılır ve iş çalıştırmasının ayrıntıları çalışma alanında görüntülenir.

Python, R, Scala veya SQL not defterini iş olarak çalıştırma

Visual Studio Code için Databricks uzantısını kullanarak bir not defterini Azure Databricks işi olarak çalıştırmak ve uzantıyı ve projenizi açmak için:

  1. İş olarak çalıştırmak istediğiniz not defterini açın.

    İpucu

    Python, R, Scala veya SQL dosyasını Azure Databricks not defterine dönüştürmek için, açıklamayı # Databricks notebook source dosyanın başına ekleyin ve açıklamayı # COMMAND ---------- her hücreden önce ekleyin. Daha fazla bilgi için bkz . Dosyayı içeri aktarma ve not defterine dönüştürme.

    Databricks not defteri olarak biçimlendirilmiş python kod dosyası1

  2. Aşağıdakilerden birini yapın:

    • Not defteri dosya düzenleyicisinin başlık çubuğunda Databricks'te Çalıştır simgesine ve ardından Dosyayı İş Akışı Olarak Çalıştır'a tıklayın.

    Not

    Databricks'te İş Akışı Olarak Çalıştır kullanılamıyorsa bkz. Özel çalıştırma yapılandırması oluşturma.

    • Gezgini görünümünde (Görünüm > Gezgini), not defteri dosyasına sağ tıklayın ve bağlam menüsünden Databricks'te Çalıştır>Dosyayı İş Akışı Olarak Çalıştır seçin.

Databricks İş Çalıştırması başlıklı yeni bir düzenleyici sekmesi görüntülenir. Not defteri çalışma alanında bir iş olarak çalışır. Not defteri ve çıktısı yeni düzenleyici sekmesinin Çıkış alanında görüntülenir.

İş çalıştırması hakkındaki bilgileri görüntülemek için Databricks İş Çalıştırması düzenleyicisi sekmesinde Görev çalıştırma kimliği bağlantısına tıklayın. Çalışma alanınız açılır ve iş çalıştırmasının ayrıntıları çalışma alanında görüntülenir.

Özel çalıştırma yapılandırması oluşturma

Visual Studio Code için Databricks uzantısı için özel çalıştırma yapılandırması, özel bağımsız değişkenleri bir işe veya not defterine geçirmenize veya farklı dosyalar için farklı çalıştırma ayarları oluşturmanıza olanak tanır.

Özel çalıştırma yapılandırması oluşturmak için Visual Studio Code'daki ana menüden Yapılandırma Ekle'yi Çalıştır'a > tıklayın. Ardından küme tabanlı çalıştırma yapılandırması için Databricks veya iş tabanlı çalıştırma yapılandırması için Databricks: workflow seçin.

Örneğin, aşağıdaki özel çalıştırma yapılandırması, bağımsız değişkeni işe geçirmek için Dosyayı İş Akışı--prod:

{
  "version": "0.2.0",
  "configurations": [
    {
      "type": "databricks-workflow",
      "request": "launch",
      "name": "Run on Databricks as Workflow",
      "program": "${file}",
      "parameters": {},
      "args": ["--prod"]
    }
  ]
}

İpucu

Python yapılandırmasını kullanmak ancak uzantı kurulumunun bir parçası olan Databricks Connect kimlik doğrulamasından yararlanmak istiyorsanız yapılandırmanıza "databricks": true ekleyin"type": "python".

Özel çalıştırma yapılandırmalarını kullanarak komut satırı bağımsız değişkenlerini geçirebilir ve yalnızca F5 tuşuna basarak kodunuzu çalıştırabilirsiniz. Daha fazla bilgi için Visual Studio Code belgelerindeki Yapılandırmaları başlatma bölümüne bakın.