Pano veri kümelerini oluşturma ve yönetme
Bu makalede, yapay zeka/BI panosundaki veri kümesi düzenleyicisini kullanarak pano veri kümelerinin nasıl oluşturulacağı ve yönetileceğini açıklanmaktadır.
Veri kümelerini tanımlama
Mevcut veri kümelerini tanımlamak veya bu veri kümelerine erişmek için panonuzun sol üst köşesindeki Veri sekmesine tıklayın. Pano başına en fazla 100 veri kümesi tanımlayabilirsiniz.
Veri kümelerini şu şekilde tanımlayabilirsiniz:
- Bir veya daha fazla tablo veya görünüm üzerinde yeni bir sorgu.
- Mevcut Unity Kataloğu tablosu veya görünümü.
Tüm veri kümeleri bir sorgu tarafından tanımlanır. Mevcut bir Unity Kataloğu tablosunu veya görünümünü seçtiğinizde, söz konusu veri kümesinin sorgusu söz konusu tablo veya görünümde SELECT *
bir deyimdir. Veri kümesini daraltmak için sorguyu değiştirebilirsiniz.
Veri kümesinin, ek SQL'de sarmalanabilen bir sorgu tarafından üretilmesi gerekir.
DESCRIBE
veya EXPLAIN
gibi komutlardan alınan çıkışlar veri kümesi olarak geçerli değildir. Ayrıca, pano sorguları salt okunur olduğundan, CREATE TABLE
, INSERT
veya DELETE
gibi verileri değiştiren ifadeler desteklenmez.
Veri kümesini tanımladıktan sonra, aşağıdaki seçeneklere erişmek için veri kümesi adının sağındaki kebap menüsünü kullanın:
Yeniden Adlandır: Veri kümenize açıklayıcı bir ad verin; böylece siz ve ekibiniz düzenlemek veya gözden geçirmek istediğiniz sorguları hızla tanımlayabilirsiniz.
Ad önerin: Sorguyu temel alan önerilen bir adı otomatik olarak oluşturun. Bu adı oluşturulduktan sonra düzenleyebilirsiniz.
Klon: Sorgunuzun aynı konumda kopyasını oluşturun. Sorgu kopyalandıktan sonra düzenleyebilirsiniz.
Sil: Veri kümesini sil. Veri kümesi tuvalde kullanılıyorsa bu seçenek kullanılamaz.
İndir: Veri kümesini CSV, TSV veya Excel dosyası olarak indirebilirsiniz.
gösterir
Not
Tuvalde kullanılmakta olan veri kümeleri mavi bir simgeyle kalın metinde görünürken, kullanılmayan veri kümelerinde gri bir simge ve kalın olmayan adlar bulunur.
Sonuçlar tablosunu görüntüleme
Bir veri kümesi oluşturduğunuzda, sorgu otomatik olarak çalıştırılır ve sonuçlar düzenleyicinin altındaki bölmede bir tablo olarak görünür. Her sütun, veri türünü gösteren bir simge içerir.
Sütun değerlerini sıralamak için:
-
sıralama simgesini göstermek için her sütunun üzerine gelin.
- Değerleri artan veya azalan düzende sıralamak için simgeye tıklayın.
Sorgu sonuç şemasını görüntüleme
Tanımlanan veri kümenizin şemasını görüntülemek için, Sonuç Tablosusağındaki Şema'ya tıklayın. Şeması sekmesi, tanımlı veri kümesindeki tüm alanları listeler. Her alan, sütunun veri türünü belirten bir simgeyle etiketlenmiştir. Şema sekmesinde temel alınan tablo veya görünümlere ait açıklamalar görüntülenir.
Hesaplanan ölçüler
Hesaplanan ölçüler, veri kümesini oluşturan SQL'i değiştirmeden mevcut bir veri kümesine hesaplamalar uygulamak için bir yol sunar. Hesaplanan ölçüleri oluşturma ve kullanma hakkında daha fazla bilgi edinmek için bkz. Hesaplanan ölçüler nedir?
Çok deyimli sorgular yazma
Bazı durumlarda, birden çok SQL deyimi kullanarak bir veri kümesi oluşturmak isteyebilirsiniz. Birden çok deyim çalıştırmak için her deyimi noktalı virgülle (;
) sonlandırabilirsiniz. Veri kümesini oluşturmak için bu komutları çalıştırdığınızda çıktı, düzenleyicideki son deyimin sonuçlarını gösterir. Bu veri kümesi tuvaldeki ilgili görselleştirmeler için kullanılır.
Deyimler, verildikleri veri kümesinde yereldir. Örneğin, kataloğu veya şemayı ayarlamak için USE
deyimine sahip bir veri kümesi oluşturursanız, bu ayar yalnızca bu veri kümesi için geçerlidir.
Örnekler
Aşağıdaki örneklerde çok deyimli sorgular için yaygın kullanımlar gösterilmektedir.
Kataloğu ve şemayı ayarlama
Sorgunuzdaki tablonun kataloğunu ve şemasını bildirmek için bir USE
deyimi yazabilirsiniz. Aşağıdaki sorgu üç deyim içerir. İlki katalog adını ayarlar. İkincisi şemayı ayarlar. katalog ve şema ayarlandığı için SELECT
deyimi yalnızca tablo adına başvurur. Bkz. USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
ANSI modunu ayarlama
ANSI_MODE
ile çalıştırılacak sorguyu TRUE
veya FALSE
olarak ayarlayabilirsiniz. Databricks SQL için, ANSI_MODE
için sistem varsayılan değeri TRUE
. Bkz. ANSI_MODE.
Aşağıdaki sorgu, geçersiz veri türü girişlerinin hata vermek yerine ANSI_MODE
döndürmesi için FALSE
NULL
ayarlar.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Karmaşık sorguları parametreleştirme
Ortak bir tablo ifadesinin veya diğer karmaşık sorgunun görünüm adını parametreleştirmek için birden çok deyim kullanabilirsiniz.
Aşağıdaki sorgu iki geçici görünüm oluşturur.
SELECT
deyimi, giriş dizesini tablo adı olarak yorumlamak için IDENTIFIER
yan tümcesini kullanır. bkz. madde
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Değişkenleri ayarlama
Aşağıdaki sorgu, ilk deyimde bir değişken ve değer bildirir. İkinci deyim değişkenin değerini değiştirir. Üçüncü deyim değişkeninin bitiş değerinin 5 olduğunu gösterir. Geçici değişkenleri kullanmayla ilgili ayrıntılar ve tam söz dizimi için bkz. SET VARIABLE.
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);
SQL ile veri erişimini sınırlama
Pano görüntüleyicileri, görselleştirmelerde gösterilmese bile bir veri kümesindeki tüm verilere erişebilir. Hassas verilerin tarayıcıda kullanıma sunulmasını önlemek için sql sorgusundaki veri kümesini tanımlayan sütunları kısıtlayın. Örneğin, bir tablodan tüm sütunları seçmek yerine yalnızca görselleştirmeler için gereken belirli alanları ekleyin.