Aracılığıyla paylaş


Öğretici: KQL veritabanını sorgulamak için Apache Spark ile not defteri kullanma

Not defterleri hem veri analizi açıklamalarını içeren okunabilir belgeler hem de veri analizi gerçekleştirmek için çalıştırılabilir belgelerdir. Bu makalede, Apache Spark kullanarak bir KQL veritabanına veri okumak ve yazmak için Microsoft Fabric not defterini kullanmayı öğreneceksiniz. Bu öğreticide hem Gerçek Zamanlı Zeka hem de Microsoft Fabric'teki Veri Madenciliği ortamlarında önceden oluşturulmuş veri kümeleri ve not defterleri kullanılır. Not defterleri hakkında daha fazla bilgi için bkz . Microsoft Fabric not defterlerini kullanma.

Özellikle şunların nasıl yapılacağını öğrenirsiniz:

  • KQL veritabanı oluşturma
  • Not defterini içeri aktarma
  • Apache Spark kullanarak KQL veritabanına veri yazma
  • KQL veritabanından verileri sorgulama

Önkoşullar

1- KQL veritabanı oluşturma

  1. Sol gezinti çubuğundan çalışma alanınızı seçin.

  2. Olay akışı oluşturmaya başlamak için aşağıdaki adımlardan birini izleyin:

    • Yeni öğe seçin ve daha sonra Eventhouse. Eventhouse adı alanına nycGreenTaxigirin ve Oluşturöğesini seçin. Aynı ada sahip bir KQL veritabanı oluşturulur.
    • Mevcut bir etkinlik evinde Veritabanlarıöğesini seçin. KQL veritabanları altında+seçin. KQL Veritabanı Adı alanına nycGreenTaxigirin, ardından Oluşturseçin.
  3. Sorgu URI'sini veritabanı panosundaki veritabanı ayrıntıları kartından kopyalayın ve sonraki bir adımda kullanmak üzere not defteri gibi bir yere yapıştırın.

     Veritabanı ayrıntılarını gösteren veritabanı ayrıntıları kartının ekran görüntüsü. URI Kopyala başlıklı Sorgu URI'si seçeneği vurgulanır.

2- NYC GreenTaxi not defterini indirin

Spark bağlayıcısını kullanarak veritabanınıza veri yüklemek için gerekli tüm adımları gerçekleştirmenizi sağlayan örnek bir not defteri oluşturduk.

  1. NYC GreenTaxi KQL not defterini indirmek için GitHub'da Doku örnekleri deposunu açın..

    NYC GreenTaxi not defterini gösteren GitHub deposunun ekran görüntüsü. Ham seçeneği vurgulanır.

  2. Not defterini cihazınıza yerel olarak kaydedin.

    Not

    Not defterinin dosya biçiminde kaydedilmesi .ipynb gerekir.

3- Not defterini içeri aktarma

Bu iş akışının geri kalanı ürünün Veri Madenciliği bölümünde gerçekleşir ve KQL veritabanınıza veri yüklemek ve sorgulamak için bir Spark not defteri kullanır.

  1. Çalışma alanınızdan >Not Defterini İçeri Aktar>seçeneğini seçin. Ardından,>Karşıya Yükle seçeneğine tıklayın ve bir önceki adımda indirdiğiniz NYC GreenTaxi not defterini seçin.

    İçeri aktarma durumu penceresinin ekran görüntüsü. Karşıya Yükle başlıklı düğme vurgulanır.

  2. İçeri aktarma işlemi tamamlandıktan sonra çalışma alanınızdan not defterini açın.

4- Veri alma

Spark bağlayıcısını kullanarak veritabanınızı sorgulamak için NYC GreenTaxi blob kapsayıcısına okuma ve yazma erişimi vermeniz gerekir.

Aşağıdaki hücreleri çalıştırmak için yürüt düğmesini seçin veya hücreyi seçip Shift+ Enter tuşlarına basın. Her kod hücresi için bu adımı yineleyin.

Not

Sonraki hücreyi çalıştırmadan önce tamamlama onay işaretinin görünmesini bekleyin.

  1. NYC GreenTaxi blob kapsayıcısına erişimi etkinleştirmek için aşağıdaki hücreyi çalıştırın.

    Depolama erişim bilgilerini gösteren ilk kod hücresinin ekran görüntüsü.

  2. KustoURI'de, yer tutucu metin yerine daha önce kopyaladığınız Sorgu URI'sini yapıştırın.

  3. Yer tutucu veritabanı adını nycGreenTaxi olarak değiştirin.

  4. Yer tutucu tablo adını GreenTaxiData olarak değiştirin.

    Hedef veritabanı bilgilerini gösteren ikinci kod hücresinin ekran görüntüsü. Sorgu URI'si, veritabanı adı ve tablo adı vurgulanır.

  5. Hücreyi çalıştırın.

  6. Veritabanınıza veri yazmak için sonraki hücreyi çalıştırın. Bu adımın tamamlanması birkaç dakika sürebilir.

    Tablo eşleme ve alma komutunu gösteren üçüncü kod hücresinin ekran görüntüsü.

Veritabanınızda artık GreenTaxiData adlı bir tabloda veriler yüklü.

5- Not defterini çalıştırma

Tablonuzdaki verileri sorgulamak için kalan iki hücreyi sıralı olarak çalıştırın. Sonuçlar, yıla göre kaydedilen en yüksek ve en düşük 20 taksi ücretini ve mesafeyi gösterir.

Sorgu sonuçlarını gösteren dördüncü ve beşinci kod hücresinin ekran görüntüsü.

6- Kaynakları temizleme

Oluşturuldukları çalışma alanına giderek oluşturulan öğeleri temizleyin.

  1. Çalışma alanınızda, silmek istediğiniz not defterinin üzerine gelin, Diğer menüsünü seçin [...] >Sil'i seçin.

    NYC GreenTaxi not defterinin açılan menüsünü gösteren çalışma alanının ekran görüntüsü. Sil başlıklı seçenek vurgulanır.

  2. Sil'i seçin. Not defterinizi sildikten sonra kurtaramazsınız.