Erstellen und Verwalten von Dashboard-Datasets
In diesem Artikel wird erläutert, wie Sie Dashboard-Datasets mithilfe des Dataset-Editors in einem KI/BI-Dashboard erstellen und verwalten.
Definieren von Datasets
Um vorhandene Datasets zu definieren oder auf sie zuzugreifen, klicken Sie in der oberen linken Ecke des Dashboards auf die Registerkarte Daten. Sie können bis zu 100 Datasets pro Dashboard definieren.
Sie können Datensätze wie definieren:
- Eine neue Abfrage für Tabellen oder Ansichten.
- Eine vorhandene Unity Catalog-Tabelle oder -Ansicht.
Alle Datasets werden durch eine Abfrage definiert. Wenn Sie eine vorhandene Unity Catalog-Tabelle oder -Ansicht auswählen, ist die Abfrage für dieses Dataset eine SELECT *
-Anweisung für diese Tabelle oder Ansicht. Sie können die Abfrage ändern, um das Dataset einzuschränken.
Ein Dataset muss von einer Abfrage erstellt werden, die in zusätzliche SQL-Abfragen eingebettet werden kann. Ausgaben von Befehlen wie DESCRIBE
oder EXPLAIN
sind nicht als Datasets gültig. Darüber hinaus sind Dashboardabfragen schreibgeschützt, sodass Anweisungen wie CREATE TABLE
, INSERT
oder DELETE
, die Daten ändern, nicht unterstützt werden.
Verwenden Sie nach dem Definieren eines Datasets das Optionsmenü rechts neben dem Datasetnamen, um auf die folgenden Optionen zuzugreifen:
Umbenennen: Geben Sie Ihrem Dataset einen aussagekräftigen Namen, damit Sie und Ihr Team schnell die Abfragen identifizieren können, die Sie bearbeiten oder prüfen möchten.
Vorgeschlagener Name: Generieren Sie basierend auf der Abfrage einen vorgeschlagenen Namen automatisch. Sie können diesen Namen bearbeiten, nachdem er generiert wurde.
Klonen: Erstellen Sie eine direkte Kopie Ihrer Abfrage. Sie können die Abfrage bearbeiten, nachdem sie geklont wurde.
Löschen: Datensatz löschen. Diese Option ist nicht verfügbar, wenn das Dataset am Zeichenbereich verwendet wird.
Herunterladen: Sie können das Dataset als CSV-, TSV- oder Excel-Datei herunterladen.
Hinweis
Datensätze, die derzeit auf der Arbeitsfläche verwendet werden, erscheinen fett gedruckt mit einem blauen Symbol, während nicht verwendete Datensätze ein graues Symbol und nicht fett gedruckte Namen haben.
Anzeigen der Ergebnistabelle
Wenn Sie ein Dataset erstellen, wird die Abfrage automatisch ausgeführt, und die Ergebnisse werden als Tabelle im Bereich unterhalb des Editors angezeigt. Jede Spalte enthält ein Symbol, das den Datentyp angibt.
So werden Spaltenwerte sortiert:
- Fahren Sie mit der Maus über jede Spalte, um das
anzuzeigen.
- Klicken Sie auf das Symbol, um die Werte in aufsteigender oder absteigender Reihenfolge zu sortieren.
Anzeigen des Schemas für Abfrageergebnisse
Um das Schema des definierten Datasets anzuzeigen, klicken Sie auf Schema rechts neben Ergebnistabelle. Auf der Registerkarte Schema werden alle Felder aus dem definierten Dataset aufgelistet. Jedes Feld ist mit einem Symbol beschriftet, das den Datentyp der Spalte angibt. Wenn die zugrundeliegenden Tabellen oder Ansichten Kommentare enthalten, werden sie auf der Registerkarte Schema angezeigt.
Berechnete Measures
Berechnete Kennzahlen bieten eine Möglichkeit, Berechnungen auf ein vorhandenes Dataset anzuwenden, ohne den SQL-Code zu ändern, der das Dataset erstellt. Weitere Informationen zum Erstellen und Verwenden berechneter Measures finden Sie unter Was sind berechnete Measures?
Schreiben von Abfragen mit mehreren Anweisungen
In einigen Fällen möchten Sie möglicherweise ein Dataset mit mehreren SQL-Anweisungen erstellen. Um mehrere Anweisungen auszuführen, beenden Sie jede Anweisung mit einem Strichpunkt (;
). Wenn Sie diese Befehle zum Erstellen des Datasets ausführen, zeigt die Ausgabe die Ergebnisse der letzten Anweisung im Editor an. Dieses Dataset wird für alle verwandten Visualisierungen am Zeichenbereich verwendet.
Aussagen sind lokal in dem Dataset vorhanden, in dem sie ausgegeben werden. Wenn Sie beispielsweise ein Dataset mit einer USE
-Anweisung zum Festlegen des Katalogs oder Schemas erstellen, gilt diese Einstellung nur für dieses Dataset.
Beispiele
Die folgenden Beispiele veranschaulichen allgemeine Verwendungsmöglichkeiten für Abfragen mit mehreren Anweisungen.
Festlegen des Katalogs und des Schemas
Sie können eine USE
-Anweisung schreiben, um den Katalog und das Schema für die Tabelle in Ihrer Abfrage zu deklarieren. Die folgende Abfrage enthält drei Anweisungen. Die erste legt den Katalognamen fest. Die zweite legt das Schema fest. Die SELECT
-Anweisung verweist nur auf den Tabellennamen, da der Katalog und das Schema festgelegt wurden. Siehe USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
Festlegen des ANSI-Modus
Sie können eine Abfrage ausführen, bei der ANSI_MODE
auf TRUE
oder FALSE
festgelegt ist. Für Databricks SQL ist der Systemstandardwert für ANSI_MODE
TRUE
. Siehe ANSI_MODE.
Die folgende Abfrage legt ANSI_MODE
auf FALSE
fest, sodass ungültige Datentypeingaben NULL
zurückgeben, anstatt einen Fehler auszulösen.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Parametrisieren komplexer Abfragen
Sie können mehrere Anweisungen verwenden, um den Ansichtsnamen für einen allgemeinen Tabellenausdruck oder eine andere komplexe Abfrage zu parametrisieren.
Die folgende Abfrage erstellt zwei temporäre Ansichten. Die SELECT
-Anweisung verwendet die IDENTIFIER
-Klausel, um die Eingabezeichenfolge als Tabellennamen zu interpretieren. Siehe IDENTIFIER-Klausel.
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Festlegen von Variablen
Die folgende Abfrage deklariert eine Variable und einen Wert in der ersten Anweisung. Die zweite Anweisung ändert den Wert der Variablen. Die dritte Anweisung zeigt, dass der Endwert der Variable 5 ist. Ausführliche Informationen und vollständige Syntax für die Verwendung temporärer Variablen finden Sie unter SET VARIABLE.
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);
Einschränken des Datenzugriffs mit SQL
Dashboard-Betrachter*innen können auf alle Daten in einem Dataset zugreifen, auch wenn sie nicht in Visualisierungen angezeigt werden. Um zu verhindern, dass vertrauliche Daten im Browser verfügbar gemacht werden, schränken Sie die Spalten in der SQL-Abfrage ein, die das Dataset definiert. Statt beispielsweise alle Spalten aus einer Tabelle auszuwählen, schließen Sie nur die spezifischen Felder ein, die für Visualisierungen erforderlich sind.