Creación y administración de conjuntos de datos de panel
En este artículo se explica cómo crear y administrar conjuntos de datos de panel mediante el editor de conjuntos de datos en un panel de AI/BI.
Definición de conjuntos de datos
Para definir o acceder a los conjuntos de datos existentes, haga clic en la pestaña Datos cerca de la esquina superior izquierda del panel. Puede definir hasta 100 conjuntos de datos por panel.
Puede definir conjuntos de datos como:
- Una nueva consulta en una o varias tablas o vistas.
- Una tabla o una vista de Unity Catalog existente.
Todos los conjuntos de datos se definen mediante una consulta. Al elegir una tabla o vista del Unity Catalog existente, la consulta de ese conjunto de datos es una instrucción SELECT *
en esa tabla o vista. Puede modificar la consulta para refinar el conjunto de datos.
Un conjunto de datos debe generarse mediante una consulta que se pueda encapsular en SQL adicional. Las salidas de comandos como DESCRIBE
o EXPLAIN
no son válidas como conjuntos de datos. Además, las consultas de panel son de solo lectura, por lo que no se admiten instrucciones que modifiquen datos, como CREATE TABLE
, INSERT
o DELETE
.
Después de definir un conjunto de datos, use el menú de kebab a la derecha del nombre del conjunto de datos para acceder a las opciones siguientes:
Cambiar nombre: asigne un nombre descriptivo al conjunto de datos para que usted y el equipo puedan identificar rápidamente las consultas que quieran editar o revisar.
Sugerir nombre: genera automáticamente un nombre sugerido en función de la consulta. Puede editar este nombre después de generarlo.
Clonar: crea una copia local de la consulta. Puede editar la consulta una vez clonada.
Eliminar: elimina un conjunto de datos. Esta opción no está disponible si el conjunto de datos se usa en el lienzo.
Descargar: puede descargar el conjunto de datos como un archivo CSV, TSV o Excel.
Nota
Los conjuntos de datos que se usan actualmente en el lienzo aparecen en negrita con un icono azul, mientras que los conjuntos de datos sin usar tienen un icono gris y nombres sin negrita.
Visualización de la tabla de resultados
Al crear un conjunto de datos, la consulta se ejecuta automáticamente y los resultados aparecen como una tabla en el panel debajo del editor. Cada columna incluye un icono que indica su tipo de datos.
Para ordenar los valores de columna:
- Pase el cursor sobre cada columna para mostrar el icono de orden
.
- Haga clic en el icono para ordenar los valores en orden ascendente o descendente.
Ver el esquema de resultados de la consulta
Para ver el esquema del conjunto de datos definido, haga clic en Esquema a la derecha de la Tabla de resultados. En la pestaña Esquema se enumeran todos los campos del conjunto de datos definido. Cada campo se etiqueta con un icono que indica el tipo de datos de la columna. Si las tablas o vistas subyacentes incluyen comentarios, aparecen en la pestaña Esquema.
Medidas calculadas
Las medidas calculadas ofrecen una manera de aplicar cálculos a un conjunto de datos existente sin modificar el SQL que crea el conjunto de datos. Para obtener más información sobre cómo crear y usar medidas calculadas, consulte ¿Qué son las medidas calculadas?
Escritura de consultas de varias instrucciones
En algunos casos, es posible que quiera construir un conjunto de datos mediante varias instrucciones SQL. Para ejecutar varias instrucciones, finalice cada instrucción con un punto y coma (;
). Al ejecutar esos comandos para crear el conjunto de datos, la salida muestra los resultados de la última instrucción en el editor. Este conjunto de datos se usa para las visualizaciones relacionadas en el lienzo.
Las declaraciones son locales al conjunto de datos en el que se emiten. Por ejemplo, si crea un conjunto de datos con una instrucción USE
para establecer el catálogo o el esquema, esa configuración solo se aplica a ese conjunto de datos.
Ejemplos
En los siguientes ejemplos se muestran usos comunes para consultas de varias instrucciones.
Establecer el catálogo y el esquema
Puede escribir una instrucción USE
para declarar el catálogo y el esquema de la tabla en la consulta. La siguiente consulta contiene tres declaraciones. La primera establece el nombre del catálogo. La segunda establece el esquema. La instrucción SELECT
hace referencia solo al nombre de la tabla porque se han establecido el catálogo y el esquema. Consulte USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
Establecer el modo ANSI
Puede establecer una consulta para que se ejecute con ANSI_MODE
establecido en TRUE
o FALSE
. Para Databricks SQL, el valor predeterminado del sistema para ANSI_MODE
es TRUE
. Consulte ANSI_MODE.
La consulta siguiente establece ANSI_MODE
en FALSE
para que las entradas de tipo de datos no válidas devuelvan NULL
en lugar de producir un error.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Parametrizar consultas complejas
Puede usar varias instrucciones para parametrizar el nombre de vista de una expresión de tabla común u otra consulta compleja.
La consulta siguiente crea dos vistas temporales. La instrucción SELECT
usa la cláusula IDENTIFIER
para interpretar la cadena de entrada como un nombre de tabla. Consulta la cláusula IDENTIFIER.
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Configuración de variables
La consulta que sigue declara una variable y un valor en la primera instrucción. La segunda instrucción cambia el valor de la variable. La tercera instrucción muestra que el valor final de la variable es 5. Consulte SET VARIABLE para obtener más información y la sintaxis completa para usar variables temporales.
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);
Limitar el acceso a datos con SQL
Los visores de paneles pueden acceder a todos los datos de un conjunto de datos, incluso si no se muestran en las visualizaciones. Para evitar que los datos confidenciales se expongan en el navegador, restrinja las columnas de la consulta SQL que define el conjunto de datos. Por ejemplo, en lugar de seleccionar todas las columnas de una tabla, incluya solo los campos específicos necesarios para las visualizaciones.