Aracılığıyla paylaş


Çalışma alanı dosyaları nedir?

Çalışma alanı dosyası, Azure Databricks çalışma alanı dosya ağacınızda aşağıdaki gibi listelenen türlerden biri olmayan bir dosyadır:

  • Sorgular
  • Panolar
  • Genie alanları
  • Denemeler

Bu hariç tutulan türler dışında, çalışma alanı dosyaları herhangi bir dosya türü olabilir. Bazı yaygın örnekler aşağıdakileri içermektedir:

  • .ipynb not defterleri
  • Kaynak not defterleri, .py, .sql, .rve .scala uzantılarını kullanır.
  • .py dosyaları özel modüllerde kullanılır
  • .md dosyaları, örneğin README.md
  • .csv veya diğer küçük veri dosyaları
  • .txt dosyaları
  • .whl kitaplıkları
  • Günlük dosyaları

Dosyalarla çalışma önerileri için bkz. Birimlerdeki dosyalar için öneriler ve çalışma alanı dosyaları.

Azure Databricks çalışma alanı dosya ağacınız "Databricks Git klasörleri" adlı bir Git deposuna eklenmiş klasörler içerebilir. Dosya türü desteğinde bazı ek sınırlamalar vardır. Git klasörlerinde desteklenen dosya türlerinin (eski adıyla "Depolar") listesi için bkz. Git klasörlerinde desteklenen varlık türleri.

Önemli

Databricks Runtime sürüm 11.2'de çalışma alanı dosyaları varsayılan olarak her yerde etkinleştirilir. Üretim iş yükleri için Databricks Runtime 11.3 LTS veya üzerini kullanın. Bu işleve erişemiyorsanız çalışma alanı yöneticinize başvurun.

Çalışma alanı dosyalarıyla neler yapabilirsiniz?

Azure Databricks, yerleşik bir dosya düzenleyicisi de dahil olmak üzere birçok çalışma alanı dosya türü için yerel geliştirmeye benzer işlevler sağlar. Tüm dosya türleri için tüm kullanım örnekleri desteklenmez.

Not defteri etkileşimlerindeki tanıdık desenleri kullanarak çalışma alanı dosyalarına erişimi oluşturabilir, düzenleyebilir ve yönetebilirsiniz. Yerel geliştirme gibi çalışma alanı dosyalarından kitaplık içeri aktarma işlemleri için göreli yolları kullanabilirsiniz. Daha ayrıntılı bilgi için bkz.

Çalışma alanı dosyalarında depolanan init betiklerinin özel davranışları vardır. Herhangi bir Databricks Runtime sürümünde init betiklerini depolamak ve bunlara başvurmak için çalışma alanı dosyalarını kullanabilirsiniz. Bkz. Çalışma alanı dosyalarında başlatma betiklerini depolama.

Not

Databricks Runtime 14.0 ve üzerinde, yerel olarak yürütülen kod için varsayılan geçerli çalışma dizini (CWD), çalıştırılmakta olan not defterini veya betiği içeren dizindir. Bu, Databricks Runtime 13.3 LTS ve altındaki davranışlarda bir değişikliktir. Bkz. Varsayılan geçerli çalışma dizini nedir?.

Sınırlama

  • İş akışınız uzak git deposunda bulunan kaynak kodu kullanıyorsa, geçerli dizine yazamaz veya göreli bir yol kullanarak yazamazsınız. Diğer konum seçeneklerine veri yazma.
  • Çalışma alanı dosyalarına kaydederken komutları kullanamazsınız git . Çalışma alanı dosyalarında dizin oluşturmaya .git izin verilmez.
  • Spark yürütücülerini (gibispark.read.format("csv").load("file:/Workspace/Users/<user-folder>/data.csv")) kullanarak çalışma alanı dosyalarından okuma, sunucusuz işlemde desteklenmez.
  • Yürütücüler çalışma alanı dosyalarına yazamaz.
  • Symlink'ler yalnızca /Workspacegibi os.symlink("/Workspace/Users/someone@example.com/Testing", "Testing") kök klasörü altındaki hedef dizinler için desteklenir.
  • Databricks Runtime 14.2 ve altındaki paylaşılan erişim moduna sahip kümelerdeki kullanıcı tanımlı işlevlerden (UDF) çalışma alanı dosyalarına erişilemiyor.
  • Notebook'lar yalnızca Databricks Runtime 16.2 ve üzeri ve sunucusuz ortam 2 ve üzeri için çalışma alanı dosyaları olarak desteklenir.

Dosya boyutu sınırı

  • Çalışma alanı dosya boyutu 500 MB ile sınırlıdır. Bu sınırdan daha büyük dosyaları indirmeye veya oluşturmaya çalışan işlemler başarısız olur.

Dosya erişimi izin sınırı

Etkileşimli işlem için 36 saat sonra ve işler için 30 gün sonra süresi dolan klasörlerdeki /Workspace dosyalara erişim izni. Databricks, /Workspace dosya erişimine ihtiyaç duyduklarında uzun yürütmelerin iş olarak çalıştırılmasını önerir.

Çalışma alanı dosyalarını etkinleştirme

Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek için, Databricks çalışma alanınıza erişimi olan bir not defterinden veya başka bir ortamdan /api/2.0/workspace-conf REST API'sini çağırın. Çalışma alanı dosyaları varsayılan olarak etkindir.

Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek veya yeniden etkinleştirmek için /api/2.0/workspace-conf çağırın ve enableWorkspaceFileSystem anahtarının değerini alın. trueolarak ayarlanmışsa, not defteri olmayan dosyalar çalışma alanınızda zaten etkinleştirilmiştir.

Aşağıdaki örnek, çalışma alanı dosyalarının devre dışı bırakılıp bırakılmadığından ve devre dışı bırakıldıysa yeniden etkinleştirmek için bu API'yi bir not defterinden nasıl çağırabileceğinizi gösterir.

Örnek: Databricks çalışma alanı dosya desteğini yeniden etkinleştirmeye yönelik not defteri

not defteri alma