ダッシュボード データセットの作成と管理
この記事では、AI/BI ダッシュボードのデータセット エディターを使用してダッシュボード データセットを作成および管理する方法について説明します。
データセットの定義
既存のデータセットを定義またはアクセスするには、ダッシュボードの左上隅付近にある [データ] タブをクリックします。 ダッシュボードごとに最大 100 個のデータセットを定義できます。
データセットは次のように定義できます。
- 1 つ以上のテーブルまたはビューに対する新しいクエリ。
- 既存の Unity Catalog テーブルまたはビュー。
すべてのデータセットはクエリによって定義されます。 既存の Unity Catalog のテーブルまたはビューを選択すると、そのデータセットのクエリはそのテーブルまたはビューで SELECT *
ステートメントになります。 クエリを変更してデータセットを絞り込むことができます。
データセットは、追加の SQL でラップできるクエリによって生成される必要があります。 DESCRIBE
や EXPLAIN
などのコマンドからの出力は、データセットとして有効ではありません。 また、ダッシュボード クエリは読み取り専用であるため、CREATE TABLE
、INSERT
、DELETE
など、データを変更するステートメントはサポートされません。
データセットを定義した後、データセット名の右側の ケバブ メニューを使用して、次のオプションにアクセスします。
名前の変更: データセットにわかりやすい名前を付けて、編集または確認したいクエリをすばやく特定できるようにします。
名前の提案: クエリに基づいて名前の候補が自動的に生成されます。 この名前は、生成後に編集できます。
複製: クエリのインプレース コピーを作成します。 複製後にクエリを編集できます。
削除: データセットを削除します。 このオプションは、データセットがキャンバスで使用されている場合には利用できません。
ダウンロード: データセットは、CSV、TSV、Excel の各型式のファイルとしてダウンロードできます。
メモ
キャンバスで現在使用されているデータセットは、青いアイコンが付いた太字のテキストで表示され、未使用のデータセットには灰色のアイコンと太字以外の名前が付いています。
結果テーブルの表示
データセットを作成すると、クエリが自動的に実行され、結果がエディターの下のペインにテーブルとして表示されます。 各列には、そのデータ型を示すアイコンが含まれています。
列の値を並べ替えるには、次の手順に従います。
- 各列にカーソルを合わせて、
並べ替えアイコンを表示します。
- アイコンをクリックして、値を昇順または降順で並べ替えます。
クエリ結果のスキーマの表示
定義されたデータセットのスキーマを表示するには、[結果テーブル] の右側の [スキーマ] をクリックします。 [スキーマ] タブには、定義されたデータセットのすべてのフィールドが一覧表示されます。 各フィールドは、列のデータ型を示すアイコンでラベル付けされています。 基になるテーブルまたはビューにコメントが含まれている場合は、[スキーマ] タブにそれが表示されます。
計算された指標
計算メジャーを使うと、データセットを生成するための SQL を変更することなく、既存のデータセットに対して計算を適用する方法が提供されます。 計算メジャーの作成と使用の詳細については、「計算メジャーとは」を参照してください。
複数ステートメント クエリの記述
場合によっては、複数の SQL ステートメントを使用してデータセットを構築することが必要になる場合があります。 複数のステートメントを実行するには、各ステートメントをセミコロン (;
) で区切ります。 これらのコマンドを実行してデータセットを作成すると、エディターの最後のステートメントの結果が出力に表示されます。 このデータセットは、キャンバス上の関連する視覚化に使用されます。
ステートメントは、それが発行されるデータセットに対してローカルです。 たとえば、USE
ステートメントを含むデータセットを作成してカタログまたはスキーマを設定する場合、その設定はそのデータセットにのみ適用されます。
例
次の例は、複数ステートメント クエリの一般的な使用例を示しています。
カタログとスキーマを設定する
USE
ステートメントを記述して、クエリ内のテーブルのカタログとスキーマを宣言できます。 次のクエリには、3 つのステートメントが含まれています。 1 番目でカタログ名を設定します。 2 番目ではスキーマを設定します。 カタログとスキーマが設定されているため、SELECT
ステートメントでは、テーブル名のみを参照します。 USE CATALOG を参照してください。
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
ANSI モードを設定する
ANSI_MODE
を TRUE
または FALSE
に設定してクエリを実行するよう設定できます。 Databricks SQL の場合、ANSI_MODE
のシステム既定値は TRUE
です。 ANSI_MODE を参照してください。
次のクエリは、無効なデータ型の入力によってエラーがスローされるのではなく NULL
が返されるように、ANSI_MODE
が FALSE
に設定されています。
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
複雑なクエリをパラメーター化する
複数のステートメントを使用して、共通テーブル式またはその他の複雑なクエリのビュー名をパラメーター化できます。
次のクエリでは、2 つの一時ビューが作成されます。 SELECT
ステートメントでは、IDENTIFIER
句を使用して入力文字列をテーブル名として解釈します。 条項
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
変数を設定する
次のクエリでは、最初のステートメントで変数と値を宣言します。 2 番目のステートメントで、変数の値を変更します。 3 番目のステートメントで、変数の最終的な値が 5 であることが示されます。 一時変数の使用に関する詳細と完全な構文については、SET VARIABLE を参照してください。
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);
SQL を使用したデータ アクセスの制限
ダッシュボード ビューアーでは、視覚的に表示されていない場合でも、データセット内のすべてのデータにアクセスできます。 機密データがブラウザーに送信されないようにするには、データセットを定義する SQL クエリで列の制限を行います。 たとえば、テーブルのすべての列を選択するのではなく、視覚化に必要な特定のフィールドのみを含めます。