Zdieľať cez


Použitie R v editore Power Query

Jazyk R je výkonný programovací jazyk, ktorý používajú mnohí štatistici, dátoví vedeckí pracovníci a dátoví analytici. Jazyk R môžete použiť v editore Power Query aplikácie Power BI Desktop na:

  • pripravte dátové modely,
  • Vytvárať zostavy.
  • Používaj čistenie údajov, pokročilú tvorbu údajov a analýzu sémantických modelov, ktoré zahŕňajú dokončovanie chýbajúcich údajov, predpovede, klastrovanie a ďalšie.

Inštalácia jazyka R

Jazyk R si môžete zdarma stiahnuť z odkladacieho priestoru CRAN.

Inštalácia myší

Nevyhnutným predpokladom je nainštalovať knižnicu mice v prostredí R. Bez myší kód vzorového skriptu nefunguje správne. Balík myší implementuje metódu na riešenie chýbajúcich údajov.

Postup inštalácie knižnice mice:

  1. Spustite program R.exe, napríklad C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Spustite príkaz Inštalovať z príkazového riadka R:

    install.packages('mice') 
    

Použitie R skriptu v editore Power Query

Na ukážku používania jazyka R v editore Power Query sa v tomto príklade používa sémantický model akciového trhu, ktorý je súčasťou súboru .csv.

  1. Stiahnite si EuStockMarkets_NA.csv súbor. Nezabudnite, kam ste ho uložili.

  2. Načítajte súbor do aplikácie Power BI Desktop. Na karte Domov vyberte položky Získať údaje>text/CSV.

    Snímka obrazovky zobrazuje možnosť Získať údaje, kde môžete vybrať možnosť Text/CSV.

  3. Vyberte súbor EuStockMarkets_NA.csv a potom vyberte Otvoriť. Údaje CSV sa zobrazujú v dialógovom textového/CSV súboru.

    Snímka obrazovky zobrazuje obsah vybratého .csv súboru.

  4. Ak chcete načítať údaje zo súboru, vyberte položku Načítať. Po načítaní údajov aplikáciou Power BI Desktop sa nová tabuľka zobrazí na table Polia.

    Snímka obrazovky zobrazuje údaje na table Polia.

  5. Ak chcete otvoriť Editor Power Query, na páse s nástrojmi Domov vyberte položky Transformovať údaje.

    Snímka obrazovky zobrazuje pás s nástrojmi Domov so zvýraznenou položkou Transformovať údaje.

  6. Na karte Transformovať vyberte položky Spustiť skript v jazyku R. Zobrazí sa editor Spustiť skript v jazyku R. V riadkoch 15 a 20 chýbajú údaje, ako aj v iných riadkoch, ktoré sa na obrázku nevidíte. Nasledujúce kroky ukazujú, ako za vás R tieto riadky dokončí.

    [Snímka obrazovky znázorňuje Editor Power Query s vybratou možnosťou Spustiť skript v jazyku R.

  7. V tomto príklade zadajte nasledujúci kód skriptu do poľa Script v okne Spustiť R skript.

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Nota

    Možno budete musieť prepísať premennú s názvom výstup, aby ste správne vytvorili nový sémantický model s použitými filtrami.

  8. Vyberte OK. Editor Power Query zobrazí upozornenie o ochrane osobných údajov.

    Snímka obrazovky zobrazuje upozornenie o ochrane osobných údajov s možnosťou Pokračovať.

  9. V hlásení s upozornením vyberte položky Pokračovať. V zobrazenom dialógovom okne Úrovne ochrany osobných údajov nastavte všetky zdroje údajov na verejné, aby skripty R v službe Power BI fungovali správne.

    Snímka obrazovky znázorňuje dialógové okno Úrovne ochrany osobných údajov s vybratou možnosťou Verejné súkromie.

    Ďalšie informácie o nastavení ochrany osobných údajov a ich dôsledkoch nájdete v téme Úrovne ochrany osobných údajov v aplikácii Power BI Desktop.

  10. Ak chcete spustiť skript, vyberte položku Uložiť.

    Pri spustení skriptu sa zobrazí nasledujúci výsledok:

    Snímka obrazovky výsledkov R skriptu.

    Keď v zobrazenej tabuľke vyberiete položku Tabuľka vedľa možnosti výstupného, zobrazí sa tabuľka, ako je to znázornené na nasledujúcom obrázku.

    Snímka obrazovky zobrazujúca výsledky tabuľky zo skriptu R.

    Všimnite si nový stĺpec na table Fields s názvom completedValues. V stĺpci SMI chýbajúcich hodnôt chýba niekoľko prvkov údajov. V ďalšej časti si pozrieme, ako si s tým R podarí.

    Len na päť riadkov skriptu R editor Power Query vyplnil chýbajúce hodnoty pomocou prediktívneho modelu.

Vytváranie vizuálov z údajov skriptu R

Teraz môžeme vytvoriť vizuál, aby sme videli, ako kód skriptu R s knižnicou mice dokončí chýbajúce hodnoty.

Snímka obrazovky zobrazuje vizuál so skriptom jazyka R, ktorý obsahuje chýbajúce hodnoty a dokončené hodnoty.

Všetky dokončené vizuály môžete uložiť do jedného súboru .pbix aplikácie Power BI Desktop a použiť dátový model a jeho skripty R v službe Power BI.

Nota

Po dokončení všetkých týchto krokov si môžete stiahnuť súbor .pbix.

Po nahratí súboru .pbix do služby Power BI musíte vykonať ďalšie kroky na povolenie obnovenia údajov služby a aktualizovaných vizuálov:

  • Povolenie plánovaného obnovenia pre sémantický model: Ak chcete povoliť plánované obnovenie zošita obsahujúceho sémantický model so skriptami R, pozrite si Konfigurácia plánovaného obnovenia. Tento článok obsahuje aj informácie o lokálnych bránach údajov.

  • Inštalácia brány: V počítači, v ktorom sa súbor a R nachádzajú, potrebujete lokálnu bránu údajov (osobný režim). Služba Power BI pristupuje k zošitu a opätovne vykreslí všetky aktualizované vizuály. Ďalšie informácie nájdete v téme používanie osobných brán v aplikácii Power BI.

Dôležité informácie a obmedzenia

Pri dotazoch, ktoré obsahujú skripty R vytvorené v editore Power Query existujú určité obmedzenia:

  • Všetky nastavenia zdroja údajov jazyka R musia byť nastavené na možnosť Public. Všetky ostatné kroky v dotaze editora Power Query musia byť tiež verejné.

    K nastaveniam zdroja údajov v aplikácii Power BI Desktop sa dostanete tak, že vyberiete položky Súbor>Možnosti a nastavenia>Nastavenia zdroja údajov.

    Snímka obrazovky zobrazuje dialógové okno Možnosti a nastavenia, kde môžete vybrať položku Nastavenia zdroja údajov.

    V dialógovom okne nastavenia zdroja údajov vyberte jeden alebo viacero zdrojov údajov a potom vyberte položku Upraviť povolenia. Nastavte úrovne ochrany osobných údajov na verejné.

    Snímka obrazovky znázorňuje dialógové okno nastavení zdroja údajov, kde môžete upraviť povolenia.

  • Ak chcete naplánovať obnovenie vizuálov R alebo sémantického modelu, povoľte plánované obnovenie a nainštalujte lokálnu bránu údajov (osobný režim) v počítači, ktorý obsahuje zošit a jazyk R. Podnikovú bránu nie je možné použiť na obnovenie sémantických modelov obsahujúcich skripty R v doplnku Power Query.

Pomocou jazyka R a vlastných dotazov môžete robiť najrôznejšie veci. Skúmajte a tvarujte údaje presne tak, ako sa majú zobrazovať.