Správa knižnice R
Knižnice poskytujú opätovne použiteľný kód, ktorý môžete chcieť zahrnúť do programov alebo projektov pre službu Microsoft Fabric Spark.
Microsoft Fabric podporuje modul R runtime s mnohými obľúbenými open-source balíkmi R vrátane predinštalovaných balíkov TidyVerse. Po spustení inštancie Spark sú tieto knižnice automaticky k dispozícii a môžete ich okamžite použiť v poznámkových blokoch alebo definíciách úloh služby Spark.
Knižnice R možno budete musieť aktualizovať z rôznych dôvodov. Napríklad jedna z vašich základných závislostí vydala novú verziu alebo váš tím vytvoril vlastný balík, ktorý potrebujete k dispozícii v klastroch Spark.
Na základe vášho scenára môžete použiť dva typy knižníc:
Knižnice informačných kanálov odkazovať na tie, ktoré sa nachádzajú vo verejných zdrojoch alebo odkladacích priestoroch, ako je napríklad CRAN alebo GitHub.
vlastné knižnice sú kód vytvorený vami alebo vašou organizáciou, .tar.gz možno spravovať prostredníctvom portálov na správu knižníc.
V službe Microsoft Fabric sú nainštalované dve úrovne balíkov:
prostredia: Spravovanie knižníc prostredníctvom prostredia, na opätovné použitie rovnakej množiny knižníc vo viacerých poznámkových blokoch alebo úlohách.
relácie: Inštalácia na úrovni relácie vytvorí prostredie pre konkrétnu poznámkovú reláciu. Zmena knižníc na úrovni relácie medzi reláciami nie je trvalá.
Súhrn aktuálne dostupných správaní správy knižnice R:
Typ knižnice | Inštalácia prostredia | Inštalácia na úrovni relácie |
---|---|---|
Informačný kanál R (CRAN) | Nepodporované | Podporované |
Vlastný jazyk R | Podporované | Podporované |
Predpoklady
Získajte predplatné služby Microsoft Fabric . Alebo si zaregistrujte bezplatnú skúšobnú služby Microsoft Fabric.
Prihláste sa do služby Microsoft Fabric.
Pomocou prepínača skúseností v ľavej dolnej časti domovskej stránky sa prepnete na službu Fabric.
Knižnice R na úrovni relácie
Pri interaktívnej analýze údajov alebo strojovom učení môžete vyskúšať novšie balíky alebo by ste mohli potrebovať balíky, ktoré momentálne nie sú vo vašom pracovnom priestore k dispozícii. Namiesto aktualizácie nastavení pracovného priestoru môžete použiť balíky v rámci relácie na pridávanie, spravovanie a aktualizáciu závislostí relácie.
- Pri inštalácii knižníc v rámci relácie má prístup k zadaným knižniciam len aktuálny poznámkový blok.
- Tieto knižnice nemajú vplyv na iné relácie alebo úlohy, ktoré používajú rovnaký fond Spark.
- Tieto knižnice sú nainštalované nad základnými knižnicami modulu runtime a knižníc na úrovni fondu.
- Knižnice poznámkových blokov majú najvyššiu prioritu.
- Knižnice R v rozsahu relácií sa v rámci relácií neuchovajú. Tieto knižnice sú nainštalované na začiatku každej relácie pri vykonávaní súvisiacich inštalačných príkazov.
- Knižnice R v rozsahu relácie sa automaticky nainštalujú naprieč uzlami ovládačov aj pracovníkov.
Nota
Príkazy na spravovanie knižníc R sú pri spúšťaní úloh kanála zakázané. Ak chcete nainštalovať balík v rámci kanála, musíte použiť funkcie správy knižnice na úrovni pracovného priestoru.
Inštalácia balíkov R z CRAN
Knižnicu R môžete jednoducho nainštalovať zo CRAN.
# install a package from CRAN
install.packages(c("nycflights13", "Lahman"))
Snímky CRAN môžete použiť aj ako odkladací priestor, aby ste zakaždým stiahli rovnakú verziu balíka.
# install a package from CRAN snapsho
install.packages("highcharter", repos = "https://cran.microsoft.com/snapshot/2021-07-16/")
Inštalácia balíkov R pomocou devtools
Knižnica devtools
zjednodušuje vývoj balíkov na urýchlenie bežných úloh. Táto knižnica sa nainštaluje v predvolenom režime runtime služby Microsoft Fabric.
Pomocou devtools
môžete určiť konkrétnu verziu knižnice, ktorá sa má nainštalovať. Tieto knižnice sú nainštalované v rámci všetkých uzlov v rámci klastra.
# Install a specific version.
install_version("caesar", version = "1.0.0")
Podobne môžete nainštalovať knižnicu priamo z GitHubu.
# Install a GitHub library.
install_github("jtilly/matchingR")
V súčasnosti sú v rámci služby Microsoft Fabric podporované nasledujúce devtools
funkcie:
Príkaz | Popis |
---|---|
install_github() | Nainštaluje sa balík R z GitHubu |
install_gitlab() | Nainštaluje sa balík R z GitLab |
install_bitbucket() | Nainštaluje balík R z BitBucketu |
install_url() | Nainštaluje balík R z ľubovoľnej URL adresy |
install_git() | Nainštaluje sa z ľubovoľného odkladacieho priestoru systému git |
install_local() | Nainštaluje sa z lokálneho súboru na disku |
install_version() | Nainštaluje sa z konkrétnej verzie v sieti CRAN |
Inštalácia vlastných knižníc jazyka R
Ak chcete použiť vlastnú knižnicu na úrovni relácie, musíte ju najprv nahrať do pripojeného lakehouse.
Otvorte poznámkový blok, v rámci ktorému chcete použiť vlastnú knižnicu.
Na ľavej strane vyberte položku Pridať a pridajte existujúce jazero alebo vytvorte jazero.
Kliknite pravým tlačidlom myši alebo vyberte "..." vedľa položky Súbory a nahrajte .tar.gz súbor.
Po nahratí prejdite späť do poznámkového bloku. Pomocou nasledujúceho príkazu nainštalujte vlastnú knižnicu do relácie:
install.packages("filepath/filename.tar.gz", repos = NULL, type = "source")
Zobrazenie nainštalovaných knižníc
Pomocou príkazu library
dotazujte všetky knižnice nainštalované v rámci relácie.
# query all the libraries installed in current session
library()
Pomocou funkcie packageVersion
skontrolujte verziu knižnice:
# check the package version
packageVersion("caesar")
Odstránenie balíka R z relácie
Ak chcete odstrániť knižnicu z priestoru názvov, môžete použiť funkciu detach
. Tieto knižnice zostanú na disku, kým sa znova nenačítajú.
# detach a library
detach("package: caesar")
Ak chcete balík v rámci relácie odstrániť z poznámkového bloku, použite príkaz remove.packages()
. Táto zmena knižnice nemá žiadny vplyv na iné relácie v tom istom klastri. Používatelia nemôžu odinštalovať ani odobrať vstavané knižnice predvoleného modulu runtime služby Microsoft Fabric.
Nota
Nemôžete odstrániť základné balíky, ako napríklad SparkR, SparklyR alebo R.
remove.packages("caesar")
Knižnice R v rozsahu relácií a SparkR
Knižnice v rozsahu poznámkového bloku sú k dispozícii pre pracovníkov SparkR.
install.packages("stringr")
library(SparkR)
str_length_function <- function(x) {
library(stringr)
str_length(x)
}
docs <- c("Wow, I really like the new light sabers!",
"That book was excellent.",
"R is a fantastic language.",
"The service in this restaurant was miserable.",
"This is neither positive or negative.")
spark.lapply(docs, str_length_function)
Knižnice R v rozsahu relácií a sparklyr
S spark_apply()
v iskru môžete použiť všetky balíky R v službe Spark. Predvolene sa v sparklyr::spark_apply()
argument balíkov nastaví na hodnotu FALSE. To skopíruje knižnice v súčasnej libPaths pre pracovníkov, čo vám umožní importovať a používať ich na pracovníkov. Môžete napríklad spustiť nasledovné, aby ste vygenerovali správu šifrovanú pomocou sparklyr::spark_apply()
:
install.packages("caesar", repos = "https://cran.microsoft.com/snapshot/2021-07-16/")
spark_version <- sparkR.version()
config <- spark_config()
sc <- spark_connect(master = "yarn", version = spark_version, spark_home = "/opt/spark", config = config)
apply_cases <- function(x) {
library(caesar)
caesar("hello world")
}
sdf_len(sc, 5) %>%
spark_apply(apply_cases, packages=FALSE)
Súvisiaci obsah
Ďalšie informácie o funkciách jazyka R:
- Ako používať SparkR
- Ako používať iskru
- Používanie Tidyverse
- vytváranie vizualizácií v jazyku R