Başlarken: Not defterinden verileri sorgulama ve görselleştirme
Bu başlangıç makalesi SQL, Python, Scala ve R kullanarak Unity Kataloğu'nda depolanan örnek verileri sorgulamak ve ardından sorgu sonuçlarını not defterinde görselleştirmek için Azure Databricks not defterini kullanmada size yol gösterir.
Gereksinimler
Bu makaledeki görevleri tamamlamak için aşağıdaki gereksinimleri karşılamanız gerekir:
- Çalışma alanınızda Unity Kataloğu etkinleştirilmiş olmalıdır. Unity Kataloğu'nu kullanmaya başlama hakkında bilgi için bkz . Unity Kataloğu'nu ayarlama ve yönetme.
- Mevcut bir işlem kaynağını kullanma veya yeni bir işlem kaynağı oluşturma izniniz olmalıdır. Bkz. Azure Databricks'i kullanmaya başlama
veya Databricks yöneticinize başvurun.
1. Adım: Yeni not defteri oluşturma
Çalışma alanınızda not defteri oluşturmak için kenar çubuğunda Yeni'ye ve ardından Not Defteri'ne tıklayın. Çalışma alanında boş bir not defteri açılır.
Not defterlerini oluşturma ve yönetme hakkında daha fazla bilgi edinmek için bkz . Not defterlerini yönetme.
2. Adım: Tabloyu sorgulama
samples.nyctaxi.trips
Unity Kataloğu'nda, seçtiğiniz dili kullanarak tabloyu sorgular.
Aşağıdaki kodu kopyalayıp yeni boş not defteri hücresine yapıştırın. Bu kod, Unity Kataloğu'nda tabloyu sorgulamanın
samples.nyctaxi.trips
sonuçlarını görüntüler.SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
Hücreyi çalıştırmak için basın
Shift+Enter
ve ardından sonraki hücreye geçin.Sorgu sonuçları not defterinde görünür.
3. Adım: Verileri görüntüleme
Ortalama ücret miktarını, teslim alma posta koduna göre gruplandırılmış seyahat mesafesine göre görüntüleyin.
Tablo sekmesinin yanındaki Görselleştirme'ye tıklayın + ve sonra da görsel öğeye tıklayın.
Görselleştirme düzenleyicisi görüntülenir.
Görselleştirme Türü açılan listesinde Çubuğun seçili olduğunu doğrulayın.
X sütunu
fare_amount
seçin.Y sütunu
trip_distance
seçin.Toplama türü olarak seçin
Average
.Gruplandırma
pickup_zip
sütunu olarak seçin.Kaydet'e tıklayın.
Sonraki adımlar
- CSV dosyasından Unity Kataloğu'na veri ekleme ve verileri görselleştirme hakkında bilgi edinmek için bkz . Başlarken: Not defterinden CSV verilerini içeri aktarma ve görselleştirme.
- Apache Spark kullanarak Databricks'e veri yüklemeyi öğrenmek için bkz . Öğretici: Apache Spark DataFrames kullanarak verileri yükleme ve dönüştürme.
- Databricks'e veri kabulü hakkında daha fazla bilgi edinmek için bkz. Azure Databricks lakehouse'a veri işleme.
- Databricks ile verileri sorgulama hakkında daha fazla bilgi edinmek için bkz . Verileri sorgulama.
- Görselleştirmeler hakkında daha fazla bilgi edinmek için bkz . Databricks not defterlerindeki görselleştirmeler.
- Keşif veri analizi (EDA) teknikleri hakkında daha fazla bilgi edinmek için bkz. Öğretici: Databricks not defterlerini kullanan EDA teknikleri.