Megosztás a következőn keresztül:


Irányítópult-adatkészletek létrehozása és kezelése

Ez a cikk azt ismerteti, hogyan hozhat létre és kezelhet irányítópult-adathalmazokat az AI/BI-irányítópult adathalmaz-szerkesztőjével.

Adathalmazok definiálása

Meglévő adathalmazok definiálásához vagy eléréséhez kattintson az irányítópult bal felső sarkában található Adatok fülre. Irányítópultonként legfeljebb 100 adathalmazt definiálhat.

Az adathalmazokat a következőképpen definiálhatja:

  • Új lekérdezés egy vagy több táblára vagy nézetre.
  • Egy meglévő Unity Catalog-tábla vagy nézet.

Minden adathalmazt egy lekérdezés határoz meg. Ha egy meglévő Unity Catalog-táblát vagy nézetet választ, az adatkészlet lekérdezése egy SELECT * utasítás az adott táblán vagy nézeten. A lekérdezést módosíthatja az adathalmaz finomításához.

Az adatkészleteket olyan lekérdezéssel kell létrehozni, amely további SQL-be burkolható. Az olyan parancsok kimenetei, mint a DESCRIBE vagy a EXPLAIN, nem érvényesek adathalmazként. Továbbá az irányítópult-lekérdezések csak olvashatók, így az adatokat módosító utasítások (például CREATE TABLE, INSERTvagy DELETE) nem támogatottak.

Az adathalmaz definiálása után használja a Kebab menüt, kebab menüt az adathalmaz nevének jobb oldalán az alábbi lehetőségek eléréséhez:

  • Átnevezés: Adjon leíró nevet az adathalmaznak, hogy Ön és csapata gyorsan azonosíthassa a szerkeszteni vagy áttekinteni kívánt lekérdezéseket.

  • Javaslat neve: Automatikusan létrehoz egy javasolt nevet a lekérdezés alapján. Ezt a nevet a létrehozás után szerkesztheti.

  • Klónozás: Hozzon létre egy helyszíni másolatot a lekérdezésről. A lekérdezést a klónozás után szerkesztheti.

  • Törlés: Adathalmaz törlése. Ez a beállítás nem érhető el, ha az adathalmaz vászonra van helyezve.

  • Letöltés: Az adathalmazt CSV-, TSV- vagy Excel-fájlként töltheti le.

    menü megjeleníti az adathalmaz beállításait

Jegyzet

A vásznon jelenleg használt adathalmazok kék ikonnal, félkövér szövegben jelennek meg, míg a nem használt adathalmazok szürke ikonnal és nem félkövér névvel rendelkeznek.

Az eredmények táblázatának megtekintése

Adathalmaz létrehozásakor a lekérdezés automatikusan lefut, és az eredmények táblázatként jelennek meg a szerkesztő alatti panelen. Minden oszlop tartalmaz egy ikont, amely az adattípusát jelzi.

Oszlopértékek rendezése:

  • Mutasson az egyes oszlopokra a Rendezés ikon Rendezés ikon megjelenítéséhez.
  • Az ikonra kattintva növekvő vagy csökkenő sorrendbe rendezheti az értékeket.

Lekérdezés eredményséma megtekintése

A definiált adathalmaz sémájának megtekintéséhez kattintson Eredménytáblajobb oldalán található Séma elemre. A Séma lap a definiált adathalmaz összes mezőjét felsorolja. Minden mező egy ikonnal van megjelölve, amely az oszlop adattípusát jelöli. Ha az alapul szolgáló táblák vagy nézetek megjegyzéseket tartalmaznak, azok megjelennek a Séma lapon.

Számított mértékek

A számított mértékek lehetővé teszi, hogy számításokat alkalmazzanak egy meglévő adathalmazra anélkül, hogy módosítanák az adathalmazt létrehozó SQL-t. További információért a számított mértékek létrehozásáról és használatáról, lásd: Mik azok a számított mértékek?

Többutas lekérdezések írása

Bizonyos esetekben érdemes lehet több SQL-utasítással létrehozni egy adathalmazt. Több utasítás futtatásához minden utasítást pontosvesszővel (;) fejezhet be. Amikor ezeket a parancsokat futtatja az adathalmaz létrehozásához, a kimenet megjeleníti a szerkesztő utolsó utasításának eredményeit. Ez az adatkészlet a vásznon lévő kapcsolódó vizualizációkhoz használható.

Az állítások ahhoz az adatkészlethez tartoznak, amelyben azokat hozzárendelik. Ha például egy USE utasítással rendelkező adatkészletet hoz létre a katalógus vagy séma beállításához, akkor ez a beállítás csak az adott adatkészletre vonatkozik.

Példák

A következő példák bemutatják a többutas lekérdezések gyakori alkalmazásait.

Katalógus és séma beállítása

A lekérdezésben USE utasítást írhat a tábla katalógusának és sémájának deklarálásához. Az alábbi kérdés három állítást tartalmaz. Az első beállítja a katalógus nevét. A második beállítja a sémát. A SELECT utasítás csak a tábla nevére hivatkozik, mert a katalógus és a séma be van állítva. Lásd USE CATALOG.


USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;

ANSI mód beállítása

Beállíthatja, hogy a lekérdezés -t a(z) ANSI_MODETRUE vagy FALSE-paraméterrel futtassa. A Databricks SQL esetében az ANSI_MODE rendszer alapértelmezett értéke TRUE. Lásd ANSI_MODE.

Az alábbi lekérdezés beállítja a ANSI_MODE-t a FALSE-ra, hogy az érvénytelen adattípusú bemenetek hiba dobása helyett NULL adjanak vissza.

SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);

Összetett lekérdezések paraméterezése

Több utasítással paraméterezheti egy közös táblakifejezés vagy más összetett lekérdezés nézetnevét.

Az alábbi lekérdezés két ideiglenes nézetet hoz létre. A SELECT utasítás a IDENTIFIER záradékot használja a bemeneti sztring táblanévként való értelmezéséhez. Lásd a IDENTIFIER záradék.

CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)

Változók beállítása

Az alábbi lekérdezés egy változót és egy értéket deklarál az első utasításban. A második utasítás módosítja a változó értékét. A harmadik utasítás azt mutatja, hogy a változó záró értéke 5. Az ideiglenes változók használatára vonatkozó részletes és teljes szintaxist lásd a SET VARIABLE.

DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);

Adathozzáférés korlátozása AZ SQL használatával

Az irányítópult-megjelenítők akkor is hozzáférhetnek az adathalmaz összes adatához, ha azok nem jelennek meg a vizualizációkban. Ha meg szeretné akadályozni, hogy bizalmas adatok legyenek közzétéve a böngészőben, korlátozza az adathalmazt meghatározó SQL-lekérdezés oszlopait. Például ahelyett, hogy az összes oszlopot kijelöli egy táblából, csak a vizualizációkhoz szükséges mezőket adja meg.