Databricks Clean Rooms'ta çıkış tabloları oluşturma ve bunlarla çalışma
Bu makalede, bir not defteri çalıştırılması sırasında oluşturulan ve çalıştırıcı tarafından Unity Catalog meta deposuyla paylaşılan geçici salt okunur tablolar olan çıkış tabloları tanıtılmaktadır. Bu makalede, çıktı tabloları oluşturmak için not defterinin nasıl kullanılacağı ve ortak çalışanların Unity Kataloğu meta veri depolarında bu çıkış tablolarını nasıl okuyabileceği açıklanmaktadır.
Çıkış tablolarına genel bakış
Çıkış tabloları, temiz bir odada çalıştırılan not defterlerinin çıktısını unity Kataloğu meta veri deponuzdaki bir çıkış kataloğuna geçici olarak kaydetmenize olanak tanır. Burada, verileri ekibinizin not defterlerini kendileri çalıştırma olanağı olmayan üyeleri tarafından kullanılabilir hale getirebilirsiniz. Ayrıca, Azure Databricks işlerini kullanarak not defterlerini çalıştırabilir ve çıktı tablolarında görevler gerçekleştirebilirsiniz. Çıkış tabloları, Temiz Oda not defteri görev türü ve görev değerleri desteğiyle birlikte, Temiz Oda not defterlerine bağlı karmaşık iş akışları oluşturmanıza olanak tanır.
Çıkış tabloları salt okunur durumdadır.
Yalnızca not defterini çalıştıran belirli sorumlunun (kullanıcı, grup veya hizmet sorumlusu) çıkış tablosuna varsayılan okuma erişimi vardır. Yazma erişimi yok. Meta veri deposu yöneticisi, standart Unity Kataloğu ayrıcalıklarını kullanarak Azure Databricks hesabındaki diğer sorumlulara okuma erişimi verebilir.
Çıkış tabloları merkezi temiz odanın varsayılan depolama konumunda 30 gün boyunca depolanır ve Delta Sharing kullanılarak ortak çalışanın meta deposuyla paylaşılır. Çıktı tablosunu 30 günden fazla tutmak istiyorsanız, bunu yerel depolama alanına kopyalamanız gerekir.
Her not defteri çalıştırması, çıkış kataloğunda yeni bir şema oluşturur. Yeni çalıştırmalar var olan bir çıkış tablosunu ekleyemez.
Önemli
Çıkış tabloları yalnızca merkezî temiz oda AWS veya Azure üzerinde barındırıldığında desteklenir. Bununla birlikte, databricks'teki üç buluttaki (AWS, Azure ve Google Cloud) ortak çalışanlar çıktı tabloları oluşturan not defterlerini paylaşabilir ve paylaşılan not defterlerini çalıştırdığında oluşturulan çıkış tablolarını okuyabilir. Google Cloud ortak çalışanlarının Temiz Odalar özel önizlemesine katılımcı olması gerekir.
Çıkış tablosu oluşturma
Çıkış tablosu oluşturmak için üç bölümlü tablo ad alanında cr_output_catalog
ve cr_output_schema
parametrelerini kullanın. Not defterinin her çalıştırması yeni bir şema oluşturur.
Aşağıdaki örnekte, not defteri hücresi, hem collaborator.advertiser.profiles
hem de creator.publisher.profiles
tablolarında e-posta adresi görüntülenen kullanıcıları listeleyen, işbirlikçinin çıkış kataloğunda overlapping_users
adlı bir çıkış tablosu oluşturur.
CREATE TABLE identifier(:cr_output_catalog || '.' || :cr_output_schema || '.overlapping_users') AS
SELECT collab_profiles.*
FROM collaborator.advertiser.profiles AS collab_profiles
JOIN creator.publisher.profiles AS creator_profiles
ON collab_profiles.email = creator_profiles.email
Çıkış tablosunu okuma
Çıktı tabloları, not defteri yürütücüsünün meta veri deposunda bulunan paylaşılan bir katalogda görünür. Katalog Gezgini Katalog bölmesinde, Paylaşılan kataloglar listesinde görüntülenir.
Bir çıkış tablosunu okumak Unity Kataloğu'ndaki diğer tabloları okumak gibidir. Masada SELECT
, paylaşılan çıktı kataloğunda USE CATALOG
, ve otomatik olarak oluşturulan şemada USE SCHEMA
olması gerekir. Tabloyu oluşturan not defterini çalıştıran kullanıcı varsayılan olarak bu izinlere sahiptir.
Uyarı
Temiz bir oda silindiğinde, çıkış kataloğundaki tüm çıkış tabloları ve geçmiş verileri kaldırılır.
Başlamadan önce
Bu bölümde, çıktı tablolarını okumak için bulut, yapılandırma ve işlem gereksinimleri açıklanmaktadır.
Bulut gereksinimleri
Çıkış tablolarını desteklemek için merkezi temiz odanın AWS'de olması gerekirken, ortak çalışma alanları üç buluttan herhangi birinde olabilir: AWS, Azure veya Google Cloud. Google Cloud ortak çalışanlarının Temiz Odalar özel önizlemesine katılımcı olması gerekir.
Paylaşılan çıkış kataloğu gereksinimi
Çıktı tablolarını okuyabilmeniz için kullanıcının bunları barındıran kataloğu oluşturması gerekir. Bunu temiz oda başına yalnızca bir kez yapmanız gerekir. Temiz odanın sahibi varsayılan olarak çıktı kataloğunu okuma ve yönetme iznine sahiptir.
Gerekli izinler: EXECUTE_CLEAN_ROOM_TASK
- Azure Databricks çalışma alanınızda Katalog'a tıklayın
.
- Hızlı erişim sayfasında, Temiz Odalar > düğmesine tıklayın.
- Listeden temiz odayı seçin.
- Sağ bölmedeki Çıktı'nın altında Katalog oluştur'a tıklayın.
- Bir Çıkış kataloğu adı girin veya varsayılanı (olan
<clean-room-name>_output
) kabul edin.
Çıktı kataloğu, Katalog Gezgini Kataloğu bölmenizdeki Paylaşılan kataloglar listesinde görünür. Katıldığınız her temiz odanın meta veri deponuzda ortak bir çıkış kataloğu bulunabilir.
İşlem gereksinimleri
Çıktı tablolarındaki sorgular sunucusuz işlem gerektirir. Bkz Sunucusuz bilişime bağlanma.
Çıkış tablosunu okumak için gereken izinler
Çıkış tablosunu oluşturan not defterini çalıştıran kullanıcı ve temiz odanın sahibi varsayılan olarak çıkış tablosunu okuma ve yönetme iznine sahiptir. Diğer tüm kullanıcılara aşağıdaki izinler verilmelidir:
-
SELECT
tabloda -
USE CATALOG
çıkış kataloğunda -
USE SCHEMA
çıkış şemasında
Not defterini çalıştırma
Çıktı kataloğunuzda paylaşılan çıkış tabloları oluşturmak için, temiz odaya erişimi olan bir kullanıcının not defterini çalıştırması gerekir. Bkz . Not defterlerini temiz odalarda çalıştırma. Her not defteri çalıştırması yeni bir çıkış şeması ve tablosu oluşturur.
İpucu
Azure Databricks işlerini kullanarak not defterlerini çalıştırabilir ve çıktı tablolarında görevler gerçekleştirerek karmaşık iş akışlarını etkinleştirebilirsiniz. Bkz . Temiz oda not defterlerini çalıştırmak için Azure Databricks İş Akışlarını kullanma.
Çıkış tablosunu bulma ve görüntüleme
Çıkış tablosunu oluşturan not defterini çalıştıran kullanıcı, not defteri çalıştırma geçmişinde çıkış tablosunun bağlantısını bulabilir ve Odaları Temizle kullanıcı arabirimindeki ayrıntılar sayfalarını çalıştırabilir. Her iki durumda da bağlantı Çıktı şeması alanındadır. Bkz. Temiz oda not defteri çalışmalarını kontrol etme.
Çalıştırma geçmişi:
Çalıştırma ayrıntıları:
Çıktı kataloğunu, Katalog Gezgini Kataloğu bölmenizdeki Paylaşılan kataloglar listesinde de bulabilirsiniz.
Sınırlamalar
Çıkış tablolarına genel bakış ve Başlamadan önce çıkış tablolarındalistelenen gereksinimlere ek olarak aşağıdaki sınırlamalar vardır:
- Çıkış tabloları yalnızca merkezi temiz oda AWS veya Azure'da barındırıldığında ve çıkış tablosu özelliği yayımlandıktan sonra temiz oda oluşturulduğunda desteklenir.
- Yalnızca tablolar desteklenir. Örneğin, hacimler ve görünümler değildir.
- Not defteri başına en fazla 100 çıkış tablosu oluşturabilirsiniz.