Visual Studio Code için Databricks uzantısını kullanarak Databricks Connect ile not defteri hücrelerini çalıştırma ve hatalarını ayıklama
Not defterlerini, bir kerede bir hücreyi veya aynı anda tüm hücreleri çalıştırabilir ve hatalarını ayıklayabilir ve Visual Studio Code Databricks Connect tümleştirmesi için Databricks uzantısını kullanarak bunların sonuçlarını Visual Studio Code kullanıcı arabiriminde görebilirsiniz. Tüm kod yerel olarak çalıştırılırken, DataFrame işlemlerini içeren tüm kodlar uzak Azure Databricks çalışma alanında kümede çalıştırılır ve çalıştırma yanıtları yerel arayana geri gönderilir. Tüm spark kodu uzak Azure Databricks çalışma alanında kümede çalışmaya devam ederken tüm kodlarda yerel olarak hata ayıklanır. Çekirdek Spark altyapısı kodu doğrudan istemciden hata ayıklanamaz.
Not
Bu özellik Databricks Runtime 13.3 ve üzeri ile çalışır.
Visual Studio Code için Databricks uzantısında not defterleri için Databricks Connect tümleştirmesini etkinleştirmek için Visual Studio Code için Databricks uzantısına Databricks Connect'i yüklemeniz gerekir. Bkz . Visual Studio Code için Databricks uzantısı için Databricks Connect kullanarak kodda hata ayıklama.
Python not defteri hücrelerini çalıştırma
Uzantısı olan dosya adları olan .py
not defterleri için, Visual Studio Code IDE'de not defterini açtığınızda her hücrede Hücreyi Çalıştır, Yukarıda Çalıştır ve Hücrede Hata Ayıkla düğmeleri görüntülenir. Siz bir hücreyi çalıştırırken, sonuçları IDE'de ayrı bir sekmede gösterilir. Siz hata ayıkladıkça, hata ayıklanan hücrede Devam Et, Durdur ve Üzerine Adımla düğmeleri görüntülenir. Bir hücrede hata ayıklarken, değişkenlerin durumlarını izleme, çağrı yığınını ve hata ayıklama konsolunu görüntüleme gibi Visual Studio Code hata ayıklama özelliklerini kullanabilirsiniz.
Uzantısı olan dosya adları olan .ipynb
not defterleri için, not defterini Visual Studio Code IDE'de açtığınızda, not defteri ve hücreleri ek özellikler içerir. Bkz. Not Defteri Düzenleyicisi'nde Hücreleri çalıştırma ve Kod hücreleriyle çalışma.
ve uzantılı .py
dosya adları için not defteri biçimleri hakkında daha fazla bilgi için bkz.ipynb
dışarı ve içeri aktarma.
Python Jupyter noteboook hücrelerini çalıştırma
Python Jupyter not defterini.ipynb
() çalıştırmak veya hatalarını ayıklamak için:
Projenizde, çalıştırmak veya hata ayıklamak istediğiniz Python Jupyter not defterini açın. Python dosyasının Jupyter not defteri biçiminde olduğundan ve uzantısına
.ipynb
sahip olduğundan emin olun.İpucu
Komut Paleti'nin içinden Oluştur: Yeni Jupyter Notebook komutunu çalıştırarak >yeni bir Python Jupyter not defteri oluşturabilirsiniz.
Tüm hücreleri hata ayıklamadan çalıştırmak için Tüm Hücreleri Çalıştır'e tıklayın, bir ilgili hücreyi hata ayıklamadan çalıştırmak için Hücreyi Çalıştır'e tıklayın veya sınırlı hata ayıklama ile tek bir hücreyi satır satır çalıştırmak için Satır Satır Çalıştır'e tıklayın; değişken değerleri Jupyter panelinde (Görünüm > Görünümü Aç > Jupyter) görüntülenir.
Tek bir hücrede tam hata ayıklama için kesme noktaları ayarlayın ve ardından hücrenin Çalıştır düğmesinin yanındaki menüden Hücreyi Hata Ayıkla seçeneğine tıklayın.
Bu seçeneklerden birine tıkladıktan sonra eksik Python Jupyter not defteri paketi bağımlılıklarını yüklemeniz istenebilir. Yüklemek için tıklayın.
Daha fazla bilgi için bkz . VS Code'da Jupyter Not Defterleri.
Not defteri genel ayarları
Aşağıdaki not defteri genel ayarları da etkinleştirilir:
spark
örneğini temsil edendatabricks.connect.DatabricksSession
, uzantıdan Azure Databricks kimlik doğrulaması kimlik bilgileri alınarakDatabricksSession
örneği oluşturacak şekilde önceden yapılandırılmıştır. Not defteri hücresinin kodunda zaten örneği oluşturulmuşsaDatabricksSession
, bunun yerine buDatabricksSession
ayarlar kullanılır. Bkz. Python için Databricks Connect için kod örnekleri.udf
, python UDF'leri için bir diğer ad olan içinpyspark.sql.functions.udf
önceden yapılandırılmıştır. Bkz. pyspark.sql.functions.udf.sql
, içinspark.sql
diğer ad olarak önceden yapılandırılmıştır.spark
, daha önce açıklandığı gibi önceden yapılandırılmış bir örneğinidatabricks.connect.DatabricksSession
temsil eder. Bkz. Spark SQL.dbutils
,databricks-sdk
'dan içeri aktarılan ve uzantıdan Azure Databricks kimlik doğrulaması kimlik bilgileri alınarak örneklenen Databricks Yardımcı Programları örneği olarak önceden yapılandırılmıştır. Bkz . Databricks Yardımcı Programlarını Kullanma.Not
Databricks Connect'e sahip not defterleri için databricks Yardımcı Programlarının yalnızca bir alt kümesi desteklenir.
'yi etkinleştirmek
dbutils.widgets
için önce yerel geliştirme makinenizin terminalinde aşağıdaki komutu çalıştırarak Python için Databricks SDK'sını yüklemeniz gerekir:pip install 'databricks-sdk[notebook]'
display
, jupyter builtinIPython.display.display
için bir diğer ad olarak önceden yapılandırılmıştır. Bkz . IPython.display.display.displayHTML
, için bir diğer addbruntime.display.displayHTML
olarak önceden yapılandırılmıştır. Bu, içindisplay.HTML
bir diğer addıripython
. Bkz. IPython.display.html.
Not defteri sihirleri
Aşağıdaki not defteri sihirbazları da etkinleştirilir:
%fs
, arama yapmakladbutils.fs
aynıdır. Bkz. Dilleri karıştırma.%sh
, yerel makinedeki hücre büyüsünü%%script
kullanarak bir komut çalıştırır. Bu, uzak Azure Databricks çalışma alanında komutunu çalıştırmaz. Bkz. Dilleri karıştırma.%md
ve%md-sandbox
hücre sihrini%%markdown
çalıştırır. Bkz. Dilleri karıştırma.%sql
, öğesini çalıştırırspark.sql
. Bkz. Dilleri karıştırma.%pip
, yerel makinede çalışırpip install
. Bu, uzak Azure Databricks çalışma alanında çalışmazpip install
. Bkz. %pip komutları ile kitaplıkları yönetme.%run
, başka bir not defteri çalıştırır. Bkz. Not defterlerini düzenleme venot defterlerinde kodu modüler hale getirme.Not
'yi etkinleştirmek
%run
için önce yerel geliştirme makinenizin terminalinde aşağıdaki komutu çalıştırarak nbformat kitaplığını yüklemeniz gerekir:pip install nbformat
Etkinleştirilen ek özellikler şunlardır:
- Spark DataFrames, Jupyter tablo biçiminde görüntülenen pandas DataFrames'e dönüştürülür.
Sınırlamalar
Visual Studio Code'da not defterlerinde hücre çalıştırma sınırlamaları şunlardır:
- Not defterleri
%r
sihirlidir ve%scala
desteklenmez ve çağrılırsa bir hata görüntüler. Bkz. Dilleri karıştırma. - Not defteri sihirli
, tabloları göstergibi bazı DML komutlarını desteklemez.