Irányítópult-adatkészletek létrehozása és kezelése
Ez a cikk azt ismerteti, hogyan hozhat létre és kezelhet irányítópult-adathalmazokat az AI/BI-irányítópult adathalmaz-szerkesztőjével.
Adathalmazok definiálása
Meglévő adathalmazok definiálásához vagy eléréséhez kattintson az irányítópult bal felső sarkában található Adatok fülre. Irányítópultonként legfeljebb 100 adathalmazt definiálhat.
Az adathalmazokat a következőképpen definiálhatja:
- Új lekérdezés egy vagy több táblára vagy nézetre.
- Egy meglévő Unity Catalog-tábla vagy nézet.
Minden adathalmazt egy lekérdezés határoz meg. Ha egy meglévő Unity Catalog-táblát vagy nézetet választ, az adatkészlet lekérdezése egy SELECT *
utasítás az adott táblán vagy nézeten. A lekérdezést módosíthatja az adathalmaz finomításához.
Az adatkészleteket olyan lekérdezéssel kell létrehozni, amely további SQL-be burkolható. Az olyan parancsok kimenetei, mint a DESCRIBE
vagy a EXPLAIN
, nem érvényesek adathalmazként. Továbbá az irányítópult-lekérdezések csak olvashatók, így az adatokat módosító utasítások (például CREATE TABLE
, INSERT
vagy DELETE
) nem támogatottak.
Az adathalmaz definiálása után használja a kebab menüt az adathalmaz nevének jobb oldalán az alábbi lehetőségek eléréséhez:
Átnevezés: Adjon leíró nevet az adathalmaznak, hogy Ön és csapata gyorsan azonosíthassa a szerkeszteni vagy áttekinteni kívánt lekérdezéseket.
Javaslat neve: Automatikusan létrehoz egy javasolt nevet a lekérdezés alapján. Ezt a nevet a létrehozás után szerkesztheti.
Klónozás: Hozzon létre egy helyszíni másolatot a lekérdezésről. A lekérdezést a klónozás után szerkesztheti.
Törlés: Adathalmaz törlése. Ez a beállítás nem érhető el, ha az adathalmaz vászonra van helyezve.
Letöltés: Az adathalmazt CSV-, TSV- vagy Excel-fájlként töltheti le.
Jegyzet
A vásznon jelenleg használt adathalmazok kék ikonnal, félkövér szövegben jelennek meg, míg a nem használt adathalmazok szürke ikonnal és nem félkövér névvel rendelkeznek.
Az eredmények táblázatának megtekintése
Adathalmaz létrehozásakor a lekérdezés automatikusan lefut, és az eredmények táblázatként jelennek meg a szerkesztő alatti panelen. Minden oszlop tartalmaz egy ikont, amely az adattípusát jelzi.
Oszlopértékek rendezése:
- Mutasson az egyes oszlopokra a
Rendezés ikon megjelenítéséhez.
- Az ikonra kattintva növekvő vagy csökkenő sorrendbe rendezheti az értékeket.
Lekérdezés eredményséma megtekintése
A definiált adathalmaz sémájának megtekintéséhez kattintson Eredménytáblajobb oldalán található Séma elemre. A Séma lap a definiált adathalmaz összes mezőjét felsorolja. Minden mező egy ikonnal van megjelölve, amely az oszlop adattípusát jelöli. Ha az alapul szolgáló táblák vagy nézetek megjegyzéseket tartalmaznak, azok megjelennek a Séma lapon.
Számított mértékek
A számított mértékek lehetővé teszi, hogy számításokat alkalmazzanak egy meglévő adathalmazra anélkül, hogy módosítanák az adathalmazt létrehozó SQL-t. További információért a számított mértékek létrehozásáról és használatáról, lásd: Mik azok a számított mértékek?
Többutas lekérdezések írása
Bizonyos esetekben érdemes lehet több SQL-utasítással létrehozni egy adathalmazt. Több utasítás futtatásához minden utasítást pontosvesszővel (;
) fejezhet be. Amikor ezeket a parancsokat futtatja az adathalmaz létrehozásához, a kimenet megjeleníti a szerkesztő utolsó utasításának eredményeit. Ez az adatkészlet a vásznon lévő kapcsolódó vizualizációkhoz használható.
Az állítások ahhoz az adatkészlethez tartoznak, amelyben azokat hozzárendelik. Ha például egy USE
utasítással rendelkező adatkészletet hoz létre a katalógus vagy séma beállításához, akkor ez a beállítás csak az adott adatkészletre vonatkozik.
Példák
A következő példák bemutatják a többutas lekérdezések gyakori alkalmazásait.
Katalógus és séma beállítása
A lekérdezésben USE
utasítást írhat a tábla katalógusának és sémájának deklarálásához. Az alábbi kérdés három állítást tartalmaz. Az első beállítja a katalógus nevét. A második beállítja a sémát. A SELECT
utasítás csak a tábla nevére hivatkozik, mert a katalógus és a séma be van állítva. Lásd USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
ANSI mód beállítása
Beállíthatja, hogy a lekérdezés -t a(z) ANSI_MODE
TRUE
vagy FALSE
-paraméterrel futtassa. A Databricks SQL esetében az ANSI_MODE
rendszer alapértelmezett értéke TRUE
. Lásd ANSI_MODE.
Az alábbi lekérdezés beállítja a ANSI_MODE
-t a FALSE
-ra, hogy az érvénytelen adattípusú bemenetek hiba dobása helyett NULL
adjanak vissza.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Összetett lekérdezések paraméterezése
Több utasítással paraméterezheti egy közös táblakifejezés vagy más összetett lekérdezés nézetnevét.
Az alábbi lekérdezés két ideiglenes nézetet hoz létre. A SELECT
utasítás a IDENTIFIER
záradékot használja a bemeneti sztring táblanévként való értelmezéséhez. Lásd a IDENTIFIER záradék.
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Változók beállítása
Az alábbi lekérdezés egy változót és egy értéket deklarál az első utasításban. A második utasítás módosítja a változó értékét. A harmadik utasítás azt mutatja, hogy a változó záró értéke 5. Az ideiglenes változók használatára vonatkozó részletes és teljes szintaxist lásd a SET VARIABLE.
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);
Adathozzáférés korlátozása AZ SQL használatával
Az irányítópult-megjelenítők akkor is hozzáférhetnek az adathalmaz összes adatához, ha azok nem jelennek meg a vizualizációkban. Ha meg szeretné akadályozni, hogy bizalmas adatok legyenek közzétéve a böngészőben, korlátozza az adathalmazt meghatározó SQL-lekérdezés oszlopait. Például ahelyett, hogy az összes oszlopot kijelöli egy táblából, csak a vizualizációkhoz szükséges mezőket adja meg.