Κοινή χρήση μέσω


Χρήση της R στο Πρόγραμμα επεξεργασίας Power Query

Η γλώσσα R είναι μια ισχυρή γλώσσα προγραμματισμού που χρησιμοποιούν πολλοί στατιστικολόγοι, επιστήμονες δεδομένων και αναλυτές δεδομένων. Μπορείτε να χρησιμοποιήσετε την R στο Πρόγραμμα επεξεργασίας Power Query του Power BI Desktop για να κάνετε τα εξής:

  • Προετοιμασία μοντέλων δεδομένων.
  • Δημιουργήστε αναφορές.
  • Κάνετε εκκαθάριση δεδομένων, διαμόρφωση δεδομένων για προχωρημένους και ανάλυση σημασιολογικών μοντέλων, που περιλαμβάνει την ολοκλήρωση δεδομένων που απουσιάζουν, προβλέψεις, δημιουργία συμπλεγμάτων και άλλα.

Εγκατάσταση της R

Μπορείτε να κάνετε λήψη της R δωρεάν από το αποθετήριο CRAN.

Εγκατάσταση του mice

Ως προαπαιτούμενο, πρέπει να εγκαταστήσετε τη βιβλιοθήκη mice στο περιβάλλον R σας. Χωρίς mice, το δείγμα κώδικα δέσμης ενεργειών δεν λειτουργεί σωστά. Το πακέτο mice υλοποιεί μια μέθοδο για να αντιμετωπίσετε δεδομένα που απουσίες.

Για να εγκαταστήσετε τη βιβλιοθήκη mice:

  1. Εκκινήστε το πρόγραμμα R.exe, για παράδειγμα, C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Εκτελέστε την εντολή εγκατάστασης από τη γραμμή εντολών R:

    install.packages('mice') 
    

Χρήση δέσμης ενεργειών R στο Πρόγραμμα επεξεργασίας Power Query

Για να επιδείξετε τη χρήση της R στο Πρόγραμμα επεξεργασίας Power Query, αυτό το παράδειγμα χρησιμοποιεί ένα μοντέλο σημασιολογίας χρηματιστηρίου που περιέχεται σε ένα αρχείο .csv.

  1. Λήψη του αρχείου EuStockMarkets_NA.csv. Να θυμάστε πού την αποθηκεύετε.

  2. Φορτώστε το αρχείο στο Power BI Desktop. Από την καρτέλα Αρχική, επιλέξτε Λήψη δεδομένων>Κειμένου/CSV .

    Στιγμιότυπο οθόνης που εμφανίζει την επιλογή

  3. Επιλέξτε το αρχείο EuStockMarkets_NA.csv και, στη συνέχεια, επιλέξτε Άνοιγμα. Τα δεδομένα CSV εμφανίζονται στο παράθυρο διαλόγου αρχείου κειμένου/CSV.

    Στιγμιότυπο οθόνης που εμφανίζει τα περιεχόμενα του επιλεγμένου αρχείου .csv.

  4. Επιλέξτε Φόρτωση για να φορτώσετε τα δεδομένα από το αρχείο. Μετά τη φόρτωση των δεδομένων από το Power BI Desktop, ο νέος πίνακας εμφανίζεται στο τμήμα παραθύρου Πεδία.

    Στιγμιότυπο οθόνης που εμφανίζει δεδομένα στο τμήμα παραθύρου Πεδία.

  5. Για να ανοίξετε το Πρόγραμμα επεξεργασίας Power Query, από την κορδέλα Αρχική επιλέξτε Μετασχηματισμός δεδομένων.

    Στιγμιότυπο οθόνης που εμφανίζει την κορδέλα Αρχική με επισημασμένη την επιλογή Μετασχηματισμός δεδομένων.

  6. Από την καρτέλα Μετασχηματισμός, επιλέξτε Εκτέλεση δέσμης ενεργειών R. Εμφανίζεται το Εκτέλεση δέσμης ενεργειών R πρόγραμμα επεξεργασίας. Λείπουν δεδομένα από τις γραμμές 15 και 20, όπως και άλλες γραμμές που δεν μπορείτε να δείτε στην εικόνα. Τα παρακάτω βήματα δείχνουν πώς η R συμπληρώνει αυτές τις γραμμές για εσάς.

    [Στιγμιότυπο οθόνης που εμφανίζει το Πρόγραμμα επεξεργασίας Power Query με επιλεγμένο το στοιχείο Εκτέλεση δέσμης ενεργειών R.

  7. Για αυτό το παράδειγμα, εισαγάγετε τον ακόλουθο κώδικα δέσμης ενεργειών στο πλαίσιο δέσμης ενεργειών του παραθύρου Εκτέλεση δέσμης ενεργειών R.

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Σημείωση

    Ίσως χρειαστεί να αντικαταστήσετε μια μεταβλητή με την ονομασία εξόδου για να δημιουργήσετε σωστά το νέο μοντέλο σημασιολογίας με εφαρμοσμένα τα φίλτρα.

  8. Επιλέξτε OK. Το Πρόγραμμα επεξεργασίας Power Query εμφανίζει μια προειδοποίηση σχετικά με την προστασία προσωπικών δεδομένων.

    Στιγμιότυπο οθόνης που εμφανίζει την προειδοποίηση προστασίας προσωπικών δεδομένων με μια επιλογή

  9. Μέσα στο προειδοποιητικό μήνυμα, επιλέξτε Συνέχεια. Στο επίπεδα προστασίας προσωπικών δεδομένων παράθυρο διαλόγου που εμφανίζεται, ορίστε όλες τις προελεύσεις δεδομένων σε Δημόσιες για να λειτουργούν σωστά οι δέσμες ενεργειών R στην υπηρεσία Power BI.

    Στιγμιότυπο οθόνης που εμφανίζει το παράθυρο διαλόγου Επίπεδα προστασίας προσωπικών δεδομένων με επιλεγμένη την επιλογή

    Για περισσότερες πληροφορίες σχετικά με τις ρυθμίσεις προστασίας προσωπικών δεδομένων και τις συνέπειές τους, ανατρέξτε στο θέμα επιπέδων προστασίας προσωπικών δεδομένων του Power BI Desktop.

  10. Επιλέξτε Αποθήκευση για να εκτελέσετε τη δέσμη ενεργειών.

    Όταν εκτελείτε τη δέσμη ενεργειών, βλέπετε το ακόλουθο αποτέλεσμα:

    Στιγμιότυπο οθόνης των αποτελεσμάτων της δέσμης ενεργειών R.

    Όταν επιλέγετε Πίνακας δίπλα στο στοιχείο Output στον πίνακα που εμφανίζεται, παρουσιάζεται ο πίνακας, όπως φαίνεται στην παρακάτω εικόνα.

    Στιγμιότυπο οθόνης των αποτελεσμάτων πίνακα από δέσμη ενεργειών R.

    Παρατηρήστε τη νέα στήλη στο τμήμα παραθύρου Πεδία που ονομάζεται completedValues. Η στήλη τιμών SMI που λείπει διαθέτει μερικά στοιχεία δεδομένων που λείπουν. Ρίξτε μια ματιά στον τρόπο με τον οποίο η R χειρίζεται αυτό το θέμα στην επόμενη ενότητα.

    Με μια δέσμη ενεργειών R που αποτελείται από πέντε μόνο γραμμές, το Πρόγραμμα επεξεργασίας Power Query συμπλήρωσε τις τιμές που λείπουν με ένα μοντέλο πρόβλεψης.

Δημιουργία απεικονίσεων από δεδομένα δέσμης ενεργειών R

Τώρα, μπορούμε να δημιουργήσουμε μια απεικόνιση για να δούμε πώς ο κώδικα δέσμης ενεργειών R με τη βιβλιοθήκη mice συμπληρώνει τις τιμές που λείπουν.

Στιγμιότυπο οθόνης που εμφανίζει μια απεικόνιση δέσμης ενεργειών R που περιλαμβάνει τιμές που λείπουν και συμπληρωμένες τιμές.

Μπορείτε να αποθηκεύσετε όλες τις ολοκληρωμένες απεικονίσεις σε ένα αρχείο .pbix του Power BI Desktop και να χρησιμοποιήσετε το μοντέλο δεδομένων και τις δέσμες ενεργειών R του στην υπηρεσία Power BI.

Σημείωση

Μπορείτε να κάνετε λήψη ενός αρχείου .pbix με όλα αυτά τα βήματα ολοκληρωμένα.

Αφού αποστείλετε το αρχείο .pbix στην υπηρεσία Power BI, πρέπει να λάβετε άλλα μέτρα για να ενεργοποιήσετε την ανανέωση δεδομένων υπηρεσίας και τις ενημερωμένες απεικονίσεις:

  • Ενεργοποίηση προγραμματισμένης ανανέωσης για το μοντέλο σημασιολογίας: Για να ενεργοποιήσετε την προγραμματισμένη ανανέωση για το βιβλίο εργασίας που περιέχει το σημασιολογικό μοντέλο σας με δέσμες ενεργειών R, ανατρέξτε στο θέμα Ρύθμιση παραμέτρων προγραμματισμένης ανανέωσης. Αυτό το άρθρο περιλαμβάνει επίσης πληροφορίες σχετικά με τις πύλες δεδομένων εσωτερικής εγκατάστασης.

  • Εγκατάστασηπύλης: Πρέπει να έχετε εγκαταστήσει μια πύλη δεδομένων εσωτερικής εγκατάστασης (προσωπική λειτουργία) στον υπολογιστή όπου βρίσκονται το αρχείο και η R. Η υπηρεσία Power BI αποκτά πρόσβαση σε αυτό το βιβλίο εργασίας και αποδίδει εκ νέου τυχόν ενημερωμένες απεικονίσεις. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα χρήση προσωπικών πυλών στο Power BI.

Ζητήματα και περιορισμοί

Υπάρχουν ορισμένοι περιορισμοί για τα ερωτήματα που περιλαμβάνουν δέσμες ενεργειών R που έχουν δημιουργηθεί στο Πρόγραμμα επεξεργασίας Power Query:

  • Όλες οι ρυθμίσεις προέλευσης δεδομένων R πρέπει να οριστούν σε Public. Όλα τα υπόλοιπα βήματα σε ένα ερώτημα του Προγράμματος επεξεργασίας Power Query πρέπει επίσης να είναι δημόσια.

    Για να μεταβείτε στις ρυθμίσεις προέλευσης δεδομένων, στο Power BI Desktop, επιλέξτε Αρχείο>Επιλογές και ρυθμίσεις>ρυθμίσεις προέλευσης δεδομένων.

    Στιγμιότυπο οθόνης εμφανίζει το παράθυρο διαλόγου Επιλογές και ρυθμίσεις όπου μπορείτε να επιλέξετε Ρυθμίσεις προέλευσης δεδομένων.

    Στο παράθυρο διαλόγου Ρυθμίσεις προέλευσης δεδομένων, επιλέξτε μία ή περισσότερες προελεύσεις δεδομένων και, στη συνέχεια, επιλέξτε Επεξεργασία δικαιωμάτων. Ορίστε την επιπέδου προστασίας προσωπικών δεδομένων σε δημόσιο.

    Στιγμιότυπο οθόνης που εμφανίζει το παράθυρο διαλόγου Ρυθμίσεις προέλευσης δεδομένων όπου μπορείτε να επεξεργαστείτε δικαιώματα.

  • Για να προγραμματίσετε την ανανέωση των απεικονίσεων R ή του μοντέλου σημασιολογίας, ενεργοποιήστε την προγραμματισμένη ανανέωση και εγκαταστήστε μια πύλη δεδομένων εσωτερικής εγκατάστασης (προσωπική λειτουργία) στον υπολογιστή που περιέχει το βιβλίο εργασίας και την R. Δεν μπορείτε να χρησιμοποιήσετε μια εταιρική πύλη για να ανανεώσετε σημασιολογικά μοντέλα που περιέχουν δέσμες ενεργειών R στο Power Query.

Υπάρχουν πολλά πράγματα που μπορείτε να κάνετε με την R και με τα προσαρμοσμένα ερωτήματα. Εξερευνήστε και διαμορφώστε τα δεδομένα σας ακριβώς όπως θέλετε να εμφανίζονται.