Aracılığıyla paylaş


Databricks Clean Rooms'ta çıkış tabloları oluşturma ve bunlarla çalışma

Bu makalede, bir not defteri çalıştırılması sırasında oluşturulan ve çalıştırıcı tarafından Unity Catalog meta deposuyla paylaşılan geçici salt okunur tablolar olan çıkış tabloları tanıtılmaktadır. Bu makalede, çıktı tabloları oluşturmak için not defterinin nasıl kullanılacağı ve ortak çalışanların Unity Kataloğu meta veri depolarında bu çıkış tablolarını nasıl okuyabileceği açıklanmaktadır.

Çıkış tablolarına genel bakış

Çıkış tabloları, temiz bir odada çalıştırılan not defterlerinin çıktısını unity Kataloğu meta veri deponuzdaki bir çıkış kataloğuna geçici olarak kaydetmenize olanak tanır. Burada, verileri ekibinizin not defterlerini kendileri çalıştırma olanağı olmayan üyeleri tarafından kullanılabilir hale getirebilirsiniz. Ayrıca, Azure Databricks işlerini kullanarak not defterlerini çalıştırabilir ve çıktı tablolarında görevler gerçekleştirebilirsiniz. Çıkış tabloları, Temiz Oda not defteri görev türü ve görev değerleri desteğiyle birlikte, Temiz Oda not defterlerine bağlı karmaşık iş akışları oluşturmanıza olanak tanır.

Çıkış tabloları salt okunur durumdadır.

Yalnızca not defterini çalıştıran belirli sorumlunun (kullanıcı, grup veya hizmet sorumlusu) çıkış tablosuna varsayılan okuma erişimi vardır. Yazma erişimi yok. Meta veri deposu yöneticisi, standart Unity Kataloğu ayrıcalıklarını kullanarak Azure Databricks hesabındaki diğer sorumlulara okuma erişimi verebilir.

Çıkış tabloları merkezi temiz odanın varsayılan depolama konumunda 30 gün boyunca depolanır ve Delta Sharing kullanılarak ortak çalışanın meta deposuyla paylaşılır. Çıktı tablosunu 30 günden fazla tutmak istiyorsanız, bunu yerel depolama alanına kopyalamanız gerekir.

Her not defteri çalıştırması, çıkış kataloğunda yeni bir şema oluşturur. Yeni çalıştırmalar var olan bir çıkış tablosunu ekleyemez.

Önemli

Çıkış tabloları yalnızca merkezî temiz oda AWS veya Azure üzerinde barındırıldığında desteklenir. Bununla birlikte, databricks'teki üç buluttaki (AWS, Azure ve Google Cloud) ortak çalışanlar çıktı tabloları oluşturan not defterlerini paylaşabilir ve paylaşılan not defterlerini çalıştırdığında oluşturulan çıkış tablolarını okuyabilir. Google Cloud ortak çalışanlarının Temiz Odalar özel önizlemesine katılımcı olması gerekir.

Çıkış tablosu oluşturma

Çıkış tablosu oluşturmak için üç bölümlü tablo ad alanında cr_output_catalog ve cr_output_schema parametrelerini kullanın. Not defterinin her çalıştırması yeni bir şema oluşturur.

Aşağıdaki örnekte, not defteri hücresi, hem collaborator.advertiser.profiles hem de creator.publisher.profiles tablolarında e-posta adresi görüntülenen kullanıcıları listeleyen, işbirlikçinin çıkış kataloğunda overlapping_users adlı bir çıkış tablosu oluşturur.

CREATE TABLE identifier(:cr_output_catalog || '.' || :cr_output_schema || '.overlapping_users') AS
SELECT collab_profiles.*
FROM collaborator.advertiser.profiles AS collab_profiles
JOIN creator.publisher.profiles AS creator_profiles
ON collab_profiles.email = creator_profiles.email

Çıkış tablosunu okuma

Çıktı tabloları, not defteri yürütücüsünün meta veri deposunda bulunan paylaşılan bir katalogda görünür. Katalog Gezgini Katalog bölmesinde, Paylaşılan kataloglar listesinde görüntülenir.

Bir çıkış tablosunu okumak Unity Kataloğu'ndaki diğer tabloları okumak gibidir. Masada SELECT, paylaşılan çıktı kataloğunda USE CATALOG, ve otomatik olarak oluşturulan şemada USE SCHEMA olması gerekir. Tabloyu oluşturan not defterini çalıştıran kullanıcı varsayılan olarak bu izinlere sahiptir.

Uyarı

Temiz bir oda silindiğinde, çıkış kataloğundaki tüm çıkış tabloları ve geçmiş verileri kaldırılır.

Başlamadan önce

Bu bölümde, çıktı tablolarını okumak için bulut, yapılandırma ve işlem gereksinimleri açıklanmaktadır.

Bulut gereksinimleri

Çıkış tablolarını desteklemek için merkezi temiz odanın AWS'de olması gerekirken, ortak çalışma alanları üç buluttan herhangi birinde olabilir: AWS, Azure veya Google Cloud. Google Cloud ortak çalışanlarının Temiz Odalar özel önizlemesine katılımcı olması gerekir.

Paylaşılan çıkış kataloğu gereksinimi

Çıktı tablolarını okuyabilmeniz için kullanıcının bunları barındıran kataloğu oluşturması gerekir. Bunu temiz oda başına yalnızca bir kez yapmanız gerekir. Temiz odanın sahibi varsayılan olarak çıktı kataloğunu okuma ve yönetme iznine sahiptir.

Gerekli izinler: EXECUTE_CLEAN_ROOM_TASK

  1. Azure Databricks çalışma alanınızda Katalog'a tıklayın Katalog simgesi.
  2. Hızlı erişim sayfasında, Temiz Odalar > düğmesine tıklayın.
  3. Listeden temiz odayı seçin.
  4. Sağ bölmedeki Çıktı'nın altında Katalog oluştur'a tıklayın.
  5. Bir Çıkış kataloğu adı girin veya varsayılanı (olan <clean-room-name>_output) kabul edin.

Çıktı kataloğu, Katalog Gezgini Kataloğu bölmenizdeki Paylaşılan kataloglar listesinde görünür. Katıldığınız her temiz odanın meta veri deponuzda ortak bir çıkış kataloğu bulunabilir.

İşlem gereksinimleri

Çıktı tablolarındaki sorgular sunucusuz işlem gerektirir. Bkz Sunucusuz bilişime bağlanma.

Çıkış tablosunu okumak için gereken izinler

Çıkış tablosunu oluşturan not defterini çalıştıran kullanıcı ve temiz odanın sahibi varsayılan olarak çıkış tablosunu okuma ve yönetme iznine sahiptir. Diğer tüm kullanıcılara aşağıdaki izinler verilmelidir:

  • SELECT tabloda
  • USE CATALOG çıkış kataloğunda
  • USE SCHEMA çıkış şemasında

Not defterini çalıştırma

Çıktı kataloğunuzda paylaşılan çıkış tabloları oluşturmak için, temiz odaya erişimi olan bir kullanıcının not defterini çalıştırması gerekir. Bkz . Not defterlerini temiz odalarda çalıştırma. Her not defteri çalıştırması yeni bir çıkış şeması ve tablosu oluşturur.

İpucu

Azure Databricks işlerini kullanarak not defterlerini çalıştırabilir ve çıktı tablolarında görevler gerçekleştirerek karmaşık iş akışlarını etkinleştirebilirsiniz. Bkz . Temiz oda not defterlerini çalıştırmak için Azure Databricks İş Akışlarını kullanma.

Çıkış tablosunu bulma ve görüntüleme

Çıkış tablosunu oluşturan not defterini çalıştıran kullanıcı, not defteri çalıştırma geçmişinde çıkış tablosunun bağlantısını bulabilir ve Odaları Temizle kullanıcı arabirimindeki ayrıntılar sayfalarını çalıştırabilir. Her iki durumda da bağlantı Çıktı şeması alanındadır. Bkz. Temiz oda not defteri çalışmalarını kontrol etme.

Çalıştırma geçmişi:

Çalıştırma geçmişinde çıkış şeması bağlantısı

Çalıştırma ayrıntıları:

Çalıştırma ayrıntılarında çıkış şeması bağlantısı

Çıktı kataloğunu, Katalog Gezgini Kataloğu bölmenizdeki Paylaşılan kataloglar listesinde de bulabilirsiniz.

Sınırlamalar

Çıkış tablolarına genel bakış ve Başlamadan önce çıkış tablolarındalistelenen gereksinimlere ek olarak aşağıdaki sınırlamalar vardır:

  • Çıkış tabloları yalnızca merkezi temiz oda AWS veya Azure'da barındırıldığında ve çıkış tablosu özelliği yayımlandıktan sonra temiz oda oluşturulduğunda desteklenir.
  • Yalnızca tablolar desteklenir. Örneğin, hacimler ve görünümler değildir.
  • Not defteri başına en fazla 100 çıkış tablosu oluşturabilirsiniz.