Εκμάθηση: Χρήση σημειωματάριου με Apache Spark για υποβολή ερωτήματος σε βάση δεδομένων KQL
Τα σημειωματάρια είναι ευανάγνωστα έγγραφα που περιέχουν περιγραφές ανάλυσης δεδομένων και αποτελέσματα και εκτελέσιμα έγγραφα που μπορούν να εκτελεστούν για την εκτέλεση ανάλυσης δεδομένων. Σε αυτό το άρθρο, θα μάθετε πώς μπορείτε να χρησιμοποιήσετε ένα σημειωματάριο Microsoft Fabric για την ανάγνωση και εγγραφή δεδομένων σε μια βάση δεδομένων KQL χρησιμοποιώντας το Apache Spark. Αυτό το εκπαιδευτικό βοήθημα χρησιμοποιεί προκαθορισμένα σύνολα δεδομένων και σημειωματάρια τόσο στην ευφυΐα σε πραγματικό χρόνο όσο και στα περιβάλλοντα διαχείρισης δεδομένων στο Microsoft Fabric. Για περισσότερες πληροφορίες σχετικά με τα σημειωματάρια, ανατρέξτε στο θέμα Τρόπος χρήσης σημειωματάριων Microsoft Fabric.
Πιο συγκεκριμένα, θα μάθετε πώς μπορείτε να κάνετε τα εξής:
- Δημιουργία βάσης δεδομένων KQL
- Εισαγωγή σημειωματάριου
- Εγγραφή δεδομένων σε μια βάση δεδομένων KQL με χρήση του Apache Spark
- Υποβολή ερωτημάτων για δεδομένα από μια βάση δεδομένων KQL
Προαπαιτούμενα στοιχεία
- Ένας χώρος εργασίας με εκχωρημένους πόρους με δυνατότητα Microsoft Fabric
1- Δημιουργία βάσης δεδομένων KQL
Επιλέξτε τον χώρο εργασίας σας από την αριστερή γραμμή περιήγησης.
Ακολουθήστε ένα από αυτά τα βήματα για να αρχίσετε να δημιουργείτε μια ροή συμβάντων:
- Επιλέξτε νέου στοιχείου και, στη συνέχεια, Eventhouse . Στο πεδίο όνομα υπηρεσίας
, πληκτρολογήστε nycGreenTaxi και, στη συνέχεια, επιλέξτεΔημιουργία . Μια βάση δεδομένων KQL δημιουργείται με το ίδιο όνομα. - Σε μια υπάρχουσα ενότητα συμβάντων, επιλέξτε Βάσεις δεδομένων. Στην περιοχή βάσεις δεδομένων
KQL επιλέξτε, στο πεδίο όνομα βάσης δεδομένων KQL , πληκτρολογήστε nycGreenTaxi και, στη συνέχεια, επιλέξτεΔημιουργία .
- Επιλέξτε νέου στοιχείου και, στη συνέχεια, Eventhouse . Στο πεδίο όνομα υπηρεσίας
Αντιγράψτε το URI ερωτήματος από την κάρτα λεπτομερειών βάσης δεδομένων στον πίνακα εργαλείων βάσης δεδομένων και επικολλήστε το κάπου, όπως σε ένα σημειωματάριο, για χρήση σε μεταγενέστερο βήμα.
2- Λήψη του σημειωματάριου NYC GreenTaxi
Δημιουργήσαμε ένα δείγμα σημειωματάριου που σας καθοδηγεί σε όλα τα απαραίτητα βήματα για τη φόρτωση δεδομένων στη βάση δεδομένων σας, χρησιμοποιώντας τη σύνδεση Spark.
Ανοίξτε το αποθετήριο δειγμάτων Fabric στο GitHub για να κάνετε λήψη του σημειωματάριου NYC GreenTaxi KQL.
Αποθηκεύστε το σημειωματάριο τοπικά στη συσκευή σας.
Σημείωμα
Το σημειωματάριο πρέπει να αποθηκευτεί στη
.ipynb
μορφή αρχείου.
3- Εισαγωγή του σημειωματάριου
Η υπόλοιπη ροή εργασιών πραγματοποιείται στην ενότητα Διαχείριση δεδομένων του προϊόντος και χρησιμοποιεί ένα σημειωματάριο Spark για τη φόρτωση και υποβολή ερωτημάτων σε δεδομένα στη βάση δεδομένων KQL.
Από τον χώρο εργασίας σας, επιλέξτε Εισαγωγή>Σημειωματάριο>Από αυτόν τον υπολογιστή>Αποστολή, στη συνέχεια, επιλέξτε το σημειωματάριο NYC GreenTaxi που κατεβάσατε σε ένα προηγούμενο βήμα.
Όταν ολοκληρωθεί η εισαγωγή, ανοίξτε το σημειωματάριο από τον χώρο εργασίας σας.
4- Λήψη δεδομένων
Για να υποβάλετε ερώτημα στη βάση δεδομένων σας χρησιμοποιώντας τη σύνδεση Spark, πρέπει να δώσετε πρόσβαση ανάγνωσης και εγγραφής στο κοντέινερ αντικειμένων blob NYC GreenTaxi.
Επιλέξτε το κουμπί αναπαραγωγής για να εκτελέσετε τα ακόλουθα κελιά ή επιλέξτε το κελί και πατήστε Shift+ Enter. Επαναλάβετε αυτό το βήμα για κάθε κελί κώδικα.
Σημείωμα
Περιμένετε να εμφανιστεί το σημάδι ελέγχου ολοκλήρωσης πριν εκτελέσετε το επόμενο κελί.
Εκτελέστε το ακόλουθο κελί για να ενεργοποιήσετε την πρόσβαση στο κοντέινερ αντικειμένων blob NYC GreenTaxi.
Στο KustoURI, επικολλήστε το URI ερωτήματος που αντιγράψατε προηγουμένως αντί για το κείμενο κράτησης θέσης.
Αλλάξτε το όνομα της βάσης δεδομένων κράτησης θέσης σε nycGreenTaxi.
Αλλάξτε το όνομα του πίνακα κράτησης θέσης σε GreenTaxiData.
Εκτελέστε το κελί.
Εκτελέστε το επόμενο κελί για να γράψετε δεδομένα στη βάση δεδομένων σας. Μπορεί να χρειαστούν μερικά λεπτά για να ολοκληρωθεί αυτό το βήμα.
Η βάση δεδομένων σας έχει πλέον δεδομένα φορτωμένα σε έναν πίνακα με την ονομασία GreenTaxiData.
5- Εκτέλεση του σημειωματάριου
Εκτελέστε διαδοχικά τα υπόλοιπα δύο κελιά για να υποβάλετε ερωτήματα για δεδομένα από τον πίνακά σας. Τα αποτελέσματα εμφανίζουν τους 20 κορυφαίους και χαμηλότερους ναύλους ταξί και τις αποστάσεις που καταγράφονται ανά έτος.
6- Εκκαθάριση πόρων
Εκκαθαρίστε τα στοιχεία που δημιουργήθηκαν μεταβαίνοντας στον χώρο εργασίας στον οποίο δημιουργήθηκαν.
Στον χώρο εργασίας σας, τοποθετήστε τον δείκτη επάνω στο σημειωματάριο που θέλετε να διαγράψετε, επιλέξτε το μενού Περισσότερα [...] >Διαγράψτε το.
Επιλέξτε Διαγραφή. Δεν μπορείτε να ανακτήσετε το σημειωματάριό σας αφού το διαγράψετε.