Az R használata a Power Query-szerkesztőben
Az R nyelv egy hatékony programozási nyelv, amelyet sok statisztikus, adattudós és adatelemző használ. Az R-t a Power BI Desktop Power Query-szerkesztőjében a következő módon használhatja:
- Adatmodellek előkészítése.
- Jelentések létrehozása.
- Végezze el az adattisztítást, a fejlett adatformázást és a szemantikai modellelemzést, amely magában foglalja a hiányzó adatkiegészítést, az előrejelzéseket, a fürtözést stb.
Az R telepítése
Az R ingyenesen letölthető a CRAN-adattárból.
Egerek telepítése
Előfeltételként telepítenie kell a mice könyvtárat az R környezetben. Egerek nélkül a példaszkriptkód nem működik megfelelően. Az egércsomag egy módszert implementál a hiányzó adatok kezelésére.
Az egerek kódtárának telepítése:
Indítsa el a
R.exe
programot, példáulC:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Futtassa a telepítési parancsot az R-parancssorból:
install.packages('mice')
R-szkript használata a Power Query-szerkesztőben
Az R Power Query-szerkesztőben való használatának bemutatásához ez a példa egy .csv fájlban található tőzsdei szemantikai modellt használ.
Töltse le a EuStockMarkets_NA.csv fájlt. Jegyezze meg, hogy hová menti.
Töltse be a fájlt a Power BI Desktopba. A Kezdőlap lapján válassza Adatok lekérése>Szöveg/CSVlehetőséget.
Jelölje ki a EuStockMarkets_NA.csv fájlt, majd válassza a Megnyitáslehetőséget. A CSV-adatok a Szöveg/CSV fájl párbeszédpanelen jelennek meg.
Válassza betöltése lehetőséget az adatok fájlból való betöltéséhez. Miután a Power BI Desktop betöltötte az adatokat, az új tábla megjelenik a Mezők panelen.
A Power Query-szerkesztő megnyitásához a Kezdőlap menüszalagon válassza Adatok átalakításalehetőséget.
Az Átalakítás lapon válassza a R-szkript futtatásalehetőséget. Megjelenik az R-szkript futtatása szerkesztő. A 15. és a 20. sorból hiányoznak adatok, ahogy a képen nem látható többi sor is. Az alábbi lépések bemutatják, hogyan hajtja végre az R ezeket a sorokat.
Ebben a példában írja be a következő szkriptkódot a Run R szkript ablakának Szkript mezőjébe.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Jegyzet
Előfordulhat, hogy felül kell írnia egy kimeneti nevű változót az új szemantikai modell megfelelő létrehozásához az alkalmazott szűrőkkel.
Válassza OKlehetőséget. A Power Query-szerkesztő figyelmeztetést jelenít meg az adatvédelmet illetően.
A figyelmeztető üzenetben válassza a Folytatáslehetőséget. A megjelenő Adatvédelmi szintek párbeszédpanelen állítsa be az összes adatforrást úgy, hogy nyilvános, hogy az R-szkriptek megfelelően működjenek a Power BI szolgáltatásban.
További információ az adatvédelmi beállításokról és azok következményeiről: Power BI Desktop adatvédelmi szintjei.
A szkript futtatásához válassza a Mentés gombot.
A szkript futtatásakor a következő eredmény jelenik meg:
Amikor a megjelenő táblázatban a Kimeneti melletti Tábla elemet választja, a táblázat az alábbi képen látható módon jelenik meg.
Vegye észre az új oszlopot a Mezők panelen, amit completedValuesnéven neveznek. A hiányzó SMI-értékek oszlopban néhány hiányzó adatelem található. Tekintse meg, hogyan kezeli ezt az R a következő szakaszban.
Mindössze öt sornyi R-szkripttel a Power Query-szerkesztő egy prediktív modellel töltötte ki a hiányzó értékeket.
Vizualizációk létrehozása R-szkriptadatokból
Most létrehozhatunk egy vizualizációt, amely megmutatja, hogyan töltik ki a hiányzó értékeket az R-kódban használt mice könyvtár segítségével.
Az összes befejezett vizualizációt mentheti egy Power BI Desktop .pbix-fájlban, és használhatja az adatmodellt és annak R-szkripteit a Power BI szolgáltatásban.
Jegyzet
A .pbix-fájlokat letöltheti az összes lépés végrehajtásával.
Miután feltöltötte a .pbix fájlt a Power BI szolgáltatásba, további lépéseket kell tennie a szolgáltatásadatok frissítésének és a frissített vizualizációknak a engedélyezéséhez:
A szemantikai modell ütemezett frissítésének engedélyezése: Ha R-szkriptekkel szeretné engedélyezni a szemantikai modellt tartalmazó munkafüzet ütemezett frissítését, tekintse meg az Ütemezett frissítés konfigurálásacímű témakört. Ez a cikk a helyszíni adatátjárókról is tartalmaz információkat.
Átjáró telepítése: Szüksége van egy helyszíni adatátjáróra (személyes mód) arra a gépre, amelyen a fájl és az R található. A Power BI szolgáltatás hozzáfér a munkafüzethez, és újra rendereli a frissített vizualizációkat. További információ: személyes átjárók használata a Power BI.
Szempontok és korlátozások
A Power Query-szerkesztőben létrehozott R-szkripteket tartalmazó lekérdezésekre bizonyos korlátozások vonatkoznak:
Az R-adatforrás minden beállításának nyilvánoskell lennie. A Power Query-szerkesztő lekérdezésének minden más lépésének is nyilvánosnak kell lennie.
Az adatforrás beállításainak eléréséhez a Power BI Desktopban válassza Fájl>Beállítások és beállítások>Adatforrás beállításailehetőséget.
Az Adatforrás beállításai párbeszédpanelen jelöljön ki egy vagy több adatforrást, majd válassza Engedélyek szerkesztéselehetőséget. Állítsa be a adatvédelmi szintet nyilvánosra .
Az R-vizualizációk vagy szemantikai modell frissítésének ütemezéséhez engedélyezze az ütemezett frissítést, és telepítsen egy helyszíni adatátjárót (személyes módot) a munkafüzetet és az R-t tartalmazó számítógépre. Vállalati átjáróval nem frissíthet R-szkripteket tartalmazó szemantikai modelleket a Power Queryben.
Kapcsolódó tartalom
Az R és az egyéni lekérdezések sokféleképpen elvégezhetők. Fedezze fel és alakítsa az adatokat úgy, ahogyan azt meg szeretné jeleníteni.