建立乾淨的會議室
本文說明如何建立一個乾淨的空間、安全且隱私權保護的環境,讓多方可以在不直接存取彼此的數據的情況下,共同處理敏感數據。
開始之前
使用清理室所需的許可權會因工作而異:
若要建立一個無塵室,您必須擁有
CREATE CLEAN ROOM
許可權或是中繼資料存放區的系統管理員。建立者會自動被指派為其 Unity 目錄中繼資料存放區中無塵室的擁有者。若要起始參與與您共用的全新會議室,您必須是中繼存放區管理員。
共用清理室時,共同作業者的中繼存放區管理員會自動獲指派清理室的擁有權。 中繼存放區管理員可以將擁有權重新指派給非中繼存放區管理員。Databricks 是數據控管的最佳做法,建議將擁有權指派給群組。
如果您的工作區未獲指派中繼存放區管理員,您必須指派角色。 請參閱 指派中繼存放區管理員 及 管理 Unity 目錄物件擁有權。
若要在乾淨的房間里新增和移除數據資產和筆記本,您必須是清理室的擁有者,或擁有乾淨房間的
MODIFY CLEAN ROOM
許可權。 此外,您和清潔室的擁有者(如果您不是擁有者)必須在您新增的表格和視圖上加上SELECT
,在您新增的磁碟區上加上READ VOLUME
。
若要瞭解更新乾淨會議室和執行中工作的許可權需求(筆記本),請參閱 管理乾淨的會議室 和 在乾淨的會議室中執行筆記本。
每個中繼存放區最多可以建立五個乾淨的會議室。
步驟 1. 要求共同作業者的共享標識碼
您必須先擁有您要共同作業之組織的 Clean Room 共用標識碼,才能建立乾淨的會議室。 共用識別碼是一個字串,其中包含組織的全域中繼存放區標識碼 + 工作區識別元 + 聯繫人的使用者名稱(電子郵件位址)。 共同作業者可以位於任何雲端或區域中。
連絡共同作業者以要求其共用標識碼。
共同作業者可以使用「尋找您的共享識別碼」中的指示來取得共享識別碼。
步驟 2。 建立潔淨室
若要建立潔淨室,您必須使用 Catalog Explorer。
在 Azure Databricks 工作區中,按一下
目錄。
在 [ 快速存取] 頁面上,按兩下 [ 清理會議室 > ] 按鈕。
或者,單擊 [
在 [目錄] 窗格頂端,然後選取 [清理室]。
按兩下 [ 建立清理室]。
在 [ 建立清理室 ] 頁面上,輸入乾淨房間的用戶易記名稱。
名稱無法使用空格、句號或正斜線 (/)。
儲存后,您無法變更乾淨的會議室名稱。 使用共同作業者會尋找有用且描述性的名稱。
選取將建立中央清理室的雲端提供者和區域。
雲端提供者必須與您目前的工作區相同,但區域則不相同。 當您進行選擇時,請考慮貴組織的數據落地或其他原則。
(選擇性) 新增註解。
輸入共同作業者的 清理室共享識別碼。
請參閱 步驟 1。請求共同作業者的共享識別號。
您可以使用您在目前中繼存放區中的分享標識符或其他使用者的標識符,在完整部署之前先測試您的潔淨空間。 這樣做會在您目前的中繼存放區中建立兩個乾淨的工作區。 例如,如果您建立名為
test_clean_room
的乾淨房間,也會顯示名為test_clean_room_collaborator
的第二個乾淨房間。 在相同的中繼存放區中,與共同作業者一起運行筆記本,與與外部共同作業者一起運行的方式相同。 請參閱 在無塵室中執行筆記本程式。請記下指派給您(作為建立者)和共同作業者的目錄名稱。
新增至清理室的所有數據資產都會出現在中央清理室的目錄底下,而且可以使用 Unity 目錄三層命名空間中的該目錄來參考 (
<catalog>.<schema>.<table-etc>
)。選取網路存取原則類型。 建立乾淨空間之後,便無法變更此設定。
- 完整存取:不受限制的向外的網際網路存取。
- 限制存取:這會限制您指定的因特網目的地的輸出存取。 請參閱 網路原則概觀 和 管理無伺服器輸出控制的網路原則。
注意
限制存取 可能會延遲資產可用性長達 10 分鐘,且不支援 Google Cloud 共同作業者。
建立乾淨空間之後,您可以在 [安全性] 索引標籤中檢視網路存取原則。
按兩下 [ 建立清理室]。
如果您目前的工作區設定為 HIPAA 合規性安全性配置檔,則當您建立乾淨空間時,該設定會套用至中央清理室。 共同作業者必須透過具有相同安全性設定的工作區進入無塵室。 請參閱 合規性安全性配置檔。
步驟 3. 將數據資產和筆記本新增至清理室
清潔室中的任何一方(創建者和協作者)都可以將數據表、磁碟區、檢視和筆記本新增至清潔室。
所需的權限:
您必須是擁有者,或擁有
MODIFY CLEAN ROOM
乾淨的房間許可權。您和無塵室的擁有者(如果您不是擁有者)必須在任何數據表或視圖上具有
SELECT
,以及在您新增的任何磁碟區上具有READ VOLUME
,並且在父目錄和結構上具有USE CATALOG
和USE SCHEMA
。乾淨的房間擁有者必須在乾淨的房間的一生中保留這些特權。
注意
下列指示假設您返回到已設置的無塵室以新增資產。 如果您剛第一次建立乾淨的空間,精靈會逐步引導您新增數據資產和筆記本。 不論您是由精靈引導,新增這些資產的實際UI都相同。
若要新增資產:
在 Azure Databricks 工作區中,按一下
目錄。
在 [ 快速存取] 頁面上,按兩下 [ 清理會議室 > ] 按鈕。
或者,單擊 [
在 [目錄] 窗格頂端,然後選取 [清理室]。
尋找並按下您要更新的乾淨空間名稱。
按 [+ 新增資料資產] 來新增資料表、磁碟區或檢視表。
選取您要分享的資料資產,然後按下 [[新增資料資產]。
當您共用數據表、磁碟區或檢視時,可以選擇性地新增別名。 別名名稱將是清理室中唯一可見的名稱。
當您共用數據表時,可以選擇性地新增分割區子句,讓您只共用數據表的一部分。 如需如何使用分割區來限制共享項目的詳細資訊,請參閱 指定要共用的數據表分割區。
注意
若要參與同盟數據表共用的 Private Preview,請連絡您的 Azure Databricks 帳戶代表。 請參閱 什麼是湖屋聯盟?。
若要新增筆記本,請按兩下 [ + 新增筆記本 ] 按鈕,然後流覽您要新增的筆記本。
您可以選擇性地為筆記本提供替代 筆記本名稱。
您在淨室中共用的筆記本會查詢數據,並在您和其他協作者新增至淨室的資料表、檢視表和磁碟區上執行數據分析工作負載。
筆記本會以隱含核准的原則運作:您無法執行您所建立的筆記本。 您可以建立共同作業者所使用的筆記本,而共同作業者會建立您使用的筆記本。
如果您共用包含結果的筆記本,這些結果將會與您的共同作業者共用。
您可以使用筆記本來建立 輸出數據表,這些數據表在執行筆記本時會暫時共用至共同作業者的中繼存放區。 請參閱 在 Databricks Clean Rooms中建立和操作輸出表。
若要使用測試資料集,請下載 範例筆記本。
重要
新增至清理室的任何筆記本參考中涉及的表格、檢視或磁碟區,都必須使用在建立清理室時所指派的目錄名稱。「建立者」指的是清理室建立者所新增的數據資產,而「共同作業者」指的是由受邀共同作業者所新增的數據資產。 例如,建立者新增的數據表可以命名為
creator.sales.california
。同樣地,請確認筆記本使用與在潔淨室中的資料資產相關的任何別名。