Dela via


Skapa och arbeta med utdatatabeller i Databricks Clean Rooms

Den här artikeln introducerar utdatatabeller, som är tillfälliga skrivskyddade tabeller som genereras av en notebook-körning och delas till notebook-löparens Unity Catalog-metaarkiv. Den här artikeln beskriver hur du använder en notebook-fil för att skapa utdatatabeller och hur medarbetare kan läsa utdatatabellerna i unity-katalogens metaarkiv.

Översikt över utdatatabeller

Med utdatatabeller kan du tillfälligt spara utdata från notebook-filer som körs i ett rent rum i en utdatakatalog i unity-katalogens metaarkiv, där du kan göra data tillgängliga för medlemmar i ditt team som inte har möjlighet att köra notebook-filerna själva. Du kan också använda Azure Databricks-jobb för att köra notebook-filer och utföra uppgifter i utdatatabeller. I kombination med Clean Room notebook-aktivitetstypen och stöd för aktivitetsvärden låter utdatabord dig skapa komplexa arbetsflöden som bygger på Clean Room notebooks.

Utdatatabeller är skrivskyddade.

Endast det specifika huvudkontot (användare, grupp eller tjänstens huvudnamn) som kör notebook-filen har standardläsningsåtkomst till utdatatabellen. Det finns ingen skrivåtkomst. En metaarkivadministratör kan bevilja läsbehörighet till andra huvudnamn i sitt Azure Databricks-konto med hjälp av standardbehörigheter för Unity Catalog.

Resultattabeller lagras i 30 dagar i det centrala renrummets standardlagringsplats och delas med medarbetarens metadatalager med Delta Sharing. Om du vill behålla en utdatatabell i mer än 30 dagar måste du kopiera den till lokal lagring.

Varje notebook-körning skapar ett nytt schema i utdatakatalogen. Nya körningar kan inte lägga till en befintlig utdatatabell.

Viktigt!

Utdatatabeller stöds endast när det centrala rena rummet finns på AWS eller Azure. Medarbetare i Databricks i alla tre molnen – AWS, Azure och Google Cloud – kan dock dela notebook-filer som skapar utdatatabeller och kan läsa utdatatabeller som genereras när de kör delade notebook-filer. Google Cloud-medarbetare måste vara deltagare i den privata förhandsversionen av Clean Rooms.

Skapa en utdatatabell

Om du vill skapa en utdatatabell använder du parametrarna cr_output_catalog och cr_output_schema i tabellnamnområdet i tre delar. Varje körning av notebook-filen skapar ett nytt schema.

I följande exempel skapar notebook-cellen en utdatatabell med namnet overlapping_users i collborators utdatakatalog som visar de användare vars e-postadress visas i både tabellerna collaborator.advertiser.profiles och creator.publisher.profiles.

CREATE TABLE identifier(:cr_output_catalog || '.' || :cr_output_schema || '.overlapping_users') AS
SELECT collab_profiles.*
FROM collaborator.advertiser.profiles AS collab_profiles
JOIN creator.publisher.profiles AS creator_profiles
ON collab_profiles.email = creator_profiles.email

Läsa en utdatatabell

Utdatatabeller visas i en delad katalog i notebook-löparens metaarkiv. I Katalogutforskaren katalogfönstret visas de i listan över delade kataloger.

Att läsa en utdatatabell är som att läsa andra tabeller i Unity Catalog. Du måste ha SELECT i tabellen, USE CATALOG i den delade utdatakatalogen och USE SCHEMA i det automatiskt genererade schemat. Användaren som körde notebook-filen som skapade tabellen har dessa behörigheter som standard.

Innan du börjar

I det här avsnittet beskrivs moln-, konfigurations- och beräkningskrav för läsning av utdatatabeller.

Molnkrav

Även om det centrala rena rummet måste finnas på AWS för att stödja utdatatabeller, kan samarbetspartners arbetsytor finnas i något av de tre molnen: AWS, Azure eller Google Cloud. Google Cloud-medarbetare måste vara deltagare i den privata förhandsversionen av Clean Rooms.

Krav för delad utdatakatalog

Innan du kan läsa utdatatabeller måste en användare skapa katalogen som innehåller dem. Du behöver bara göra detta en gång per rent rum. Ägaren av det rena rummet har behörighet att läsa och hantera utdatakatalogen som standard.

Behörigheter som krävs: EXECUTE_CLEAN_ROOM_TASK

  1. På din Azure Databricks-arbetsyta klickar du på katalogikonen .
  2. På sidan Snabbåtkomst klickar du på knappen Rensa rum > .
  3. Välj det rena rummet i listan.
  4. I den högra rutan under Utdataklickar du på Skapa katalog.
  5. Ange ett namn på utdatakatalogen eller acceptera standardvärdet, som är <clean-room-name>_output.

Utdatakatalogen visas i listan över delade-kataloger i fönstret Katalogutforskaren Katalog. Varje rent rum som du deltar i kan ha en katalog med delade utdata i metaarkivet.

Beräkningskrav

Frågor i utdatatabeller kräver serverlös beräkning. Se Ansluta till serverlös beräkning.

Behörigheter som krävs för att läsa en utdatatabell

Användaren som körde anteckningsboken som skapade utdatatabellen och ägaren av det rena rummet har behörighet att läsa och hantera utdatatabellen som standard. Alla andra användare måste ha följande behörigheter:

  • SELECT på tabellen
  • USE CATALOG i utdatakatalogen
  • USE SCHEMA i utdataschemat

Köra anteckningsboken

För att generera delade utdatatabeller i utdatakatalogen krävs det att en användare med åtkomst till det rena rummet kör anteckningsboken. Se Kör notebook-filer i rena rum. Varje notebook-körning skapar ett nytt utdataschema och en ny tabell.

Dricks

Du kan använda Azure Databricks-jobb för att köra notebook-filer och utföra uppgifter i utdatatabeller, vilket möjliggör komplexa arbetsflöden. Mer information finns i Använda Azure Databricks-arbetsflöden för att köra anteckningsböcker för rent rum.

Hitta och visa en utdatatabell

Användaren som kör notebook-filen som skapar utdatatabellen kan hitta en länk till utdatatabellen i notebook-körningshistoriken och köra informationssidor i användargränssnittet Clean Rooms. I båda fallen finns länken i fältet utdataschema. Se Övervaka körning av anteckningsböcker för rent rum.

Körningshistorik:

utdata-schemalänk i körhistorik

Körningsinformation:

schemalänk för utdata i körningsinformation

Du kan också hitta utdatakatalogen i listan över delade kataloger i Catalog Explorer-fönstret Katalog.

Begränsningar

Förutom kraven i Översikt över utdatatabeller och Innan du börjarhar utdatatabellerna följande begränsningar:

  • Utdatatabeller stöds endast när det centrala rena rummet finns på AWS eller Azure och när det rena rummet skapades efter att utdatatabellfunktionen släpptes.
  • Endast tabeller stöds. Volymer och vyer är till exempel inte inkluderade.
  • Du kan skapa upp till 100 utdatatabeller per notebook-fil.