Öğretici: KQL veritabanını sorgulamak için Apache Spark ile not defteri kullanma
Not defterleri hem veri analizi açıklamalarını içeren okunabilir belgeler hem de veri analizi gerçekleştirmek için çalıştırılabilir belgelerdir. Bu makalede, Apache Spark kullanarak bir KQL veritabanına veri okumak ve yazmak için Microsoft Fabric not defterini kullanmayı öğreneceksiniz. Bu öğreticide hem Gerçek Zamanlı Zeka hem de Microsoft Fabric'teki Veri Madenciliği ortamlarında önceden oluşturulmuş veri kümeleri ve not defterleri kullanılır. Not defterleri hakkında daha fazla bilgi için bkz . Microsoft Fabric not defterlerini kullanma.
Özellikle şunların nasıl yapılacağını öğrenirsiniz:
- KQL veritabanı oluşturma
- Not defterini içeri aktarma
- Apache Spark kullanarak KQL veritabanına veri yazma
- KQL veritabanından verileri sorgulama
Önkoşullar
1- KQL veritabanı oluşturma
Sol gezinti çubuğundan çalışma alanınızı seçin.
Olay akışı oluşturmaya başlamak için aşağıdaki adımlardan birini izleyin:
-
Yeni öğe seçin ve daha sonra Eventhouse.
Eventhouse adı alanına nycGreenTaxigirin ve Oluştur öğesini seçin. Aynı ada sahip bir KQL veritabanı oluşturulur. - Mevcut bir etkinlik evinde Veritabanlarıöğesini seçin. KQL veritabanları altında+seçin. KQL Veritabanı Adı alanına nycGreenTaxigirin, ardından Oluşturseçin.
-
Yeni öğe seçin ve daha sonra Eventhouse.
Sorgu URI'sini veritabanı panosundaki veritabanı ayrıntıları kartından kopyalayın ve sonraki bir adımda kullanmak üzere not defteri gibi bir yere yapıştırın.
2- NYC GreenTaxi not defterini indirin
Spark bağlayıcısını kullanarak veritabanınıza veri yüklemek için gerekli tüm adımları gerçekleştirmenizi sağlayan örnek bir not defteri oluşturduk.
NYC GreenTaxi KQL not defterini indirmek için GitHub'da Doku örnekleri deposunu açın..
Not defterini cihazınıza yerel olarak kaydedin.
Not
Not defterinin dosya biçiminde kaydedilmesi
.ipynb
gerekir.
3- Not defterini içeri aktarma
Bu iş akışının geri kalanı ürünün Veri Madenciliği bölümünde gerçekleşir ve KQL veritabanınıza veri yüklemek ve sorgulamak için bir Spark not defteri kullanır.
Çalışma alanınızdan >Not Defterini İçeri Aktar>seçeneğini seçin. Ardından,>Karşıya Yükle seçeneğine tıklayın ve bir önceki adımda indirdiğiniz NYC GreenTaxi not defterini seçin.
İçeri aktarma işlemi tamamlandıktan sonra çalışma alanınızdan not defterini açın.
4- Veri alma
Spark bağlayıcısını kullanarak veritabanınızı sorgulamak için NYC GreenTaxi blob kapsayıcısına okuma ve yazma erişimi vermeniz gerekir.
Aşağıdaki hücreleri çalıştırmak için yürüt düğmesini seçin veya hücreyi seçip Shift+ Enter tuşlarına basın. Her kod hücresi için bu adımı yineleyin.
Not
Sonraki hücreyi çalıştırmadan önce tamamlama onay işaretinin görünmesini bekleyin.
NYC GreenTaxi blob kapsayıcısına erişimi etkinleştirmek için aşağıdaki hücreyi çalıştırın.
KustoURI'de, yer tutucu metin yerine daha önce kopyaladığınız Sorgu URI'sini yapıştırın.
Yer tutucu veritabanı adını nycGreenTaxi olarak değiştirin.
Yer tutucu tablo adını GreenTaxiData olarak değiştirin.
Hücreyi çalıştırın.
Veritabanınıza veri yazmak için sonraki hücreyi çalıştırın. Bu adımın tamamlanması birkaç dakika sürebilir.
Veritabanınızda artık GreenTaxiData adlı bir tabloda veriler yüklü.
5- Not defterini çalıştırma
Tablonuzdaki verileri sorgulamak için kalan iki hücreyi sıralı olarak çalıştırın. Sonuçlar, yıla göre kaydedilen en yüksek ve en düşük 20 taksi ücretini ve mesafeyi gösterir.
6- Kaynakları temizleme
Oluşturuldukları çalışma alanına giderek oluşturulan öğeleri temizleyin.
Çalışma alanınızda, silmek istediğiniz not defterinin üzerine gelin, Diğer menüsünü seçin [...] >Sil'i seçin.
Sil'i seçin. Not defterinizi sildikten sonra kurtaramazsınız.