次の方法で共有


クリーン ルームでノートブックを実行する

この記事では、クリーン ルームでノートブックを実行する方法について説明します。 ノートブックは、コラボレーターが共同でデータ分析を実行するために使用するインターフェイスです。

クリーン ルームにノートブックを追加する方法については、「クリーン ルームを作成する」を参照してください。

開始する前に

クリーン ルームでノートブックを実行するには、次の条件を満たす必要があります。

  • クリーン ルームの所有者である。またはクリーン ルームに対して EXECUTE CLEAN ROOM TASK 特権を持っている。
  • ノートブックを作成しなかったコラボレーターである。 ノートブック作成者はノートブックを実行できません。 これにより、両方の当事者によるノートブックの暗黙的な承認が適用されます。

Note

作成者は、Databricks アカウントのクリーン ルームの所有者として自動的に割り当てられます。 コラボレーターの組織のメタストア管理者には、Databricks アカウントのクリーン ルームの所有権が自動的に割り当てられます。 所有権は譲渡することができます。 「Unity Catalog オブジェクトの所有権を管理する」を参照してください。

クリーン ルームでノートブックを実行する

クリーン ルームでノートブックを実行するには、カタログ エクスプローラーを使用する必要があります。

  1. Azure Databricks ワークスペースで、カタログ アイコン[カタログ] をクリックします。

  2. [カタログ] ペインの上部にある 歯車アイコン 歯車アイコンをクリックし、[クリーン ルーム] を選択します。

    または、[クイック アクセス] ページで [クリーン ルーム] > ボタンをクリックします。

  3. 一覧からクリーン ルームを選択します。

  4. [ノートブック] でノートブックをクリックしてプレビュー モードで開きます。

  5. [実行] ボタンをクリックします。

    他のコラボレーターが共有しているノートブックのみを実行できます。

  6. (省略可能) パラメーター付きのノートブックの実行 ダイアログで、 + 追加 をクリックして、ノートブック ジョブ タスクにパラメーター値を渡します。

  7. 確認のチェックボックスをオンにします。

  8. [実行] をクリックします。

  9. [詳細を表示する] をクリックして、実行の進行状況を表示します。

    または、このページの [実行] に移動するか、ワークスペース サイドバーの [ワークフロー] をクリックして [ジョブ実行] タブに移動すると、実行の進行状況を表示できます。

  10. ノートブックの実行結果を表示します。

    実行が完了すると、ノートブックの結果が表示されます。 過去の実行を表示するには、[実行] に移動し、[開始時刻] 列のリンクをクリックします。

Note

cr_creator_input_catalog パラメーターと cr_collaborator_input_catalog パラメーターは、実行時にクリーン ルーム ノートブックに自動的に渡されます。 これらのパラメーターは、サンプル テーブルを含むローカル テストに使用できます。 ジョブ タスクのパラメーターの詳細については、「ジョブのパラメーター化」を参照してください。

出力テーブルを使用してノートブックの出力を共有する

出力テーブルは、ノートブック実行によって生成され、ノートブック ランナーのメタストアと共有される一時的な読み取り専用テーブルです。 ノートブックが出力テーブルを作成する場合、ノートブック ランナーは 出力カタログでアクセスし ワークスペース内の他のユーザーと共有できます。 Databricks Clean Rooms での出力テーブルの作成と操作を参照してください

Azure Databricks ワークフローを使用してクリーン ルーム ノートブックを実行する

Azure Databricks ジョブを使用してノートブックを実行し、出力テーブルでタスクを実行できるため、クリーン ルーム資産を含む複雑なワークフローを構築できます。 特にこれらの機能により、このようなワークフローが可能になります。

  • Clean Room ノートブック タスクの種類では、ワークフロー タスクとしてクリーン ルーム ノートブックを選択して実行できます。 ジョブについては、 Clean Room ノートブック タスクを参照してください
  • ワークフローによって開始されるノートブックの実行では、他のワークフロー タスクから参照できる出力テーブルを生成できます。 Databricks Clean Rooms での出力テーブルの作成と操作を参照してください
  • ワークフローでは、 Task 値を使用できます ジョブ パラメーター値を渡して、クリーン ルーム ノートブックを取得したり、クリーン ルーム ノートブックの出力をキャプチャしたり、その出力を他のワークフロー タスクに渡したりできます。 「タスク値を使用してタスク間で情報を渡す」を参照してください。
  • クリーン ルームの出力スキーマ名は、自動的に生成されます。 パラメーターに {{tasks.<your_task_name>.output.schema_name}}{{tasks.<your_task_name>.output.catalog_name}} を含めている場合は、ダウンストリーム ノートブック タスクで実行されたときに、それらの値をクリーン ルームから参照できます。 ノートブック タスクに移動して、[パラメーター] で値を選択します。

たとえば、次の手順を実行して、動的に生成された出力スキーマ名をタスク間で伝達するワークフローを作成できます。

  1. 次のタスク値の設定を含むノートブックを実行するタスク Clean Rooms ノートブック タスクの種類のタスクを作成します。

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. output_schema値を参照して出力を処理する後続のタスクを作成します。