Použitie R v editore Power Query
Jazyk R je výkonný programovací jazyk, ktorý používajú mnohí štatistici, dátoví vedeckí pracovníci a dátoví analytici. Jazyk R môžete použiť v editore Power Query aplikácie Power BI Desktop na:
- pripravte dátové modely,
- Vytvárať zostavy.
- Používaj čistenie údajov, pokročilú tvorbu údajov a analýzu sémantických modelov, ktoré zahŕňajú dokončovanie chýbajúcich údajov, predpovede, klastrovanie a ďalšie.
Inštalácia jazyka R
Jazyk R si môžete zdarma stiahnuť z odkladacieho priestoru CRAN.
Inštalácia myší
Nevyhnutným predpokladom je nainštalovať knižnicu mice v prostredí R. Bez myší kód vzorového skriptu nefunguje správne. Balík myší implementuje metódu na riešenie chýbajúcich údajov.
Postup inštalácie knižnice mice:
Spustite program
R.exe
, napríkladC:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Spustite príkaz Inštalovať z príkazového riadka R:
install.packages('mice')
Použitie R skriptu v editore Power Query
Na ukážku používania jazyka R v editore Power Query sa v tomto príklade používa sémantický model akciového trhu, ktorý je súčasťou súboru .csv.
Stiahnite si EuStockMarkets_NA.csv súbor. Nezabudnite, kam ste ho uložili.
Načítajte súbor do aplikácie Power BI Desktop. Na karte Domov vyberte položky Získať údaje>text/CSV.
Vyberte súbor EuStockMarkets_NA.csv a potom vyberte Otvoriť. Údaje CSV sa zobrazujú v dialógovom textového/CSV súboru.
Ak chcete načítať údaje zo súboru, vyberte položku Načítať. Po načítaní údajov aplikáciou Power BI Desktop sa nová tabuľka zobrazí na table Polia.
Ak chcete otvoriť Editor Power Query, na páse s nástrojmi Domov vyberte položky Transformovať údaje.
Na karte Transformovať vyberte položky Spustiť skript v jazyku R. Zobrazí sa editor Spustiť skript v jazyku R. V riadkoch 15 a 20 chýbajú údaje, ako aj v iných riadkoch, ktoré sa na obrázku nevidíte. Nasledujúce kroky ukazujú, ako za vás R tieto riadky dokončí.
V tomto príklade zadajte nasledujúci kód skriptu do poľa Script v okne Spustiť R skript.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Nota
Možno budete musieť prepísať premennú s názvom výstup, aby ste správne vytvorili nový sémantický model s použitými filtrami.
Vyberte OK. Editor Power Query zobrazí upozornenie o ochrane osobných údajov.
V hlásení s upozornením vyberte položky Pokračovať. V zobrazenom dialógovom okne Úrovne ochrany osobných údajov nastavte všetky zdroje údajov na verejné, aby skripty R v službe Power BI fungovali správne.
Ďalšie informácie o nastavení ochrany osobných údajov a ich dôsledkoch nájdete v téme Úrovne ochrany osobných údajov v aplikácii Power BI Desktop.
Ak chcete spustiť skript, vyberte položku Uložiť.
Pri spustení skriptu sa zobrazí nasledujúci výsledok:
Keď v zobrazenej tabuľke vyberiete položku Tabuľka vedľa možnosti výstupného, zobrazí sa tabuľka, ako je to znázornené na nasledujúcom obrázku.
Všimnite si nový stĺpec na table Fields s názvom completedValues. V stĺpci SMI chýbajúcich hodnôt chýba niekoľko prvkov údajov. V ďalšej časti si pozrieme, ako si s tým R podarí.
Len na päť riadkov skriptu R editor Power Query vyplnil chýbajúce hodnoty pomocou prediktívneho modelu.
Vytváranie vizuálov z údajov skriptu R
Teraz môžeme vytvoriť vizuál, aby sme videli, ako kód skriptu R s knižnicou mice dokončí chýbajúce hodnoty.
Všetky dokončené vizuály môžete uložiť do jedného súboru .pbix aplikácie Power BI Desktop a použiť dátový model a jeho skripty R v službe Power BI.
Nota
Po dokončení všetkých týchto krokov si môžete stiahnuť súbor .pbix.
Po nahratí súboru .pbix do služby Power BI musíte vykonať ďalšie kroky na povolenie obnovenia údajov služby a aktualizovaných vizuálov:
Povolenie plánovaného obnovenia pre sémantický model: Ak chcete povoliť plánované obnovenie zošita obsahujúceho sémantický model so skriptami R, pozrite si Konfigurácia plánovaného obnovenia. Tento článok obsahuje aj informácie o lokálnych bránach údajov.
Inštalácia brány: V počítači, v ktorom sa súbor a R nachádzajú, potrebujete lokálnu bránu údajov (osobný režim). Služba Power BI pristupuje k zošitu a opätovne vykreslí všetky aktualizované vizuály. Ďalšie informácie nájdete v téme používanie osobných brán v aplikácii Power BI.
Dôležité informácie a obmedzenia
Pri dotazoch, ktoré obsahujú skripty R vytvorené v editore Power Query existujú určité obmedzenia:
Všetky nastavenia zdroja údajov jazyka R musia byť nastavené na možnosť Public. Všetky ostatné kroky v dotaze editora Power Query musia byť tiež verejné.
K nastaveniam zdroja údajov v aplikácii Power BI Desktop sa dostanete tak, že vyberiete položky Súbor>Možnosti a nastavenia>Nastavenia zdroja údajov.
V dialógovom okne nastavenia zdroja údajov vyberte jeden alebo viacero zdrojov údajov a potom vyberte položku Upraviť povolenia. Nastavte úrovne ochrany osobných údajov na verejné.
Ak chcete naplánovať obnovenie vizuálov R alebo sémantického modelu, povoľte plánované obnovenie a nainštalujte lokálnu bránu údajov (osobný režim) v počítači, ktorý obsahuje zošit a jazyk R. Podnikovú bránu nie je možné použiť na obnovenie sémantických modelov obsahujúcich skripty R v doplnku Power Query.
Súvisiaci obsah
Pomocou jazyka R a vlastných dotazov môžete robiť najrôznejšie veci. Skúmajte a tvarujte údaje presne tak, ako sa majú zobrazovať.