Zdieľať cez


Správa knižnice R

Knižnice poskytujú opätovne použiteľný kód, ktorý môžete chcieť zahrnúť do programov alebo projektov pre službu Microsoft Fabric Spark.

Microsoft Fabric podporuje modul R runtime s mnohými obľúbenými open-source balíkmi R vrátane predinštalovaných balíkov TidyVerse. Po spustení inštancie Spark sú tieto knižnice automaticky k dispozícii a môžete ich okamžite použiť v poznámkových blokoch alebo definíciách úloh služby Spark.

Knižnice R možno budete musieť aktualizovať z rôznych dôvodov. Napríklad jedna z vašich základných závislostí vydala novú verziu alebo váš tím vytvoril vlastný balík, ktorý potrebujete k dispozícii v klastroch Spark.

Na základe vášho scenára môžete použiť dva typy knižníc:

  • Knižnice informačných kanálov odkazovať na tie, ktoré sa nachádzajú vo verejných zdrojoch alebo odkladacích priestoroch, ako je napríklad CRAN alebo GitHub.

  • vlastné knižnice sú kód vytvorený vami alebo vašou organizáciou, .tar.gz možno spravovať prostredníctvom portálov na správu knižníc.

V službe Microsoft Fabric sú nainštalované dve úrovne balíkov:

  • prostredia: Spravovanie knižníc prostredníctvom prostredia, na opätovné použitie rovnakej množiny knižníc vo viacerých poznámkových blokoch alebo úlohách.

  • relácie: Inštalácia na úrovni relácie vytvorí prostredie pre konkrétnu poznámkovú reláciu. Zmena knižníc na úrovni relácie medzi reláciami nie je trvalá.

Súhrn aktuálne dostupných správaní správy knižnice R:

Typ knižnice Inštalácia prostredia Inštalácia na úrovni relácie
Informačný kanál R (CRAN) Nepodporované Podporované
Vlastný jazyk R Podporované Podporované

Predpoklady

  • Získajte predplatné služby Microsoft Fabric . Alebo si zaregistrujte bezplatnú skúšobnú služby Microsoft Fabric.

  • Prihláste sa do služby Microsoft Fabric.

  • Pomocou prepínača skúseností v ľavej dolnej časti domovskej stránky sa prepnete na službu Fabric.

    Snímka obrazovky ponuky prepínača prostredí zobrazujúca, kde vybrať položku Dátová veda.

Knižnice R na úrovni relácie

Pri interaktívnej analýze údajov alebo strojovom učení môžete vyskúšať novšie balíky alebo by ste mohli potrebovať balíky, ktoré momentálne nie sú vo vašom pracovnom priestore k dispozícii. Namiesto aktualizácie nastavení pracovného priestoru môžete použiť balíky v rámci relácie na pridávanie, spravovanie a aktualizáciu závislostí relácie.

  • Pri inštalácii knižníc v rámci relácie má prístup k zadaným knižniciam len aktuálny poznámkový blok.
  • Tieto knižnice nemajú vplyv na iné relácie alebo úlohy, ktoré používajú rovnaký fond Spark.
  • Tieto knižnice sú nainštalované nad základnými knižnicami modulu runtime a knižníc na úrovni fondu.
  • Knižnice poznámkových blokov majú najvyššiu prioritu.
  • Knižnice R v rozsahu relácií sa v rámci relácií neuchovajú. Tieto knižnice sú nainštalované na začiatku každej relácie pri vykonávaní súvisiacich inštalačných príkazov.
  • Knižnice R v rozsahu relácie sa automaticky nainštalujú naprieč uzlami ovládačov aj pracovníkov.

Nota

Príkazy na spravovanie knižníc R sú pri spúšťaní úloh kanála zakázané. Ak chcete nainštalovať balík v rámci kanála, musíte použiť funkcie správy knižnice na úrovni pracovného priestoru.

Inštalácia balíkov R z CRAN

Knižnicu R môžete jednoducho nainštalovať zo CRAN.

# install a package from CRAN
install.packages(c("nycflights13", "Lahman"))

Snímky CRAN môžete použiť aj ako odkladací priestor, aby ste zakaždým stiahli rovnakú verziu balíka.

# install a package from CRAN snapsho
install.packages("highcharter", repos = "https://cran.microsoft.com/snapshot/2021-07-16/")

Inštalácia balíkov R pomocou devtools

Knižnica devtools zjednodušuje vývoj balíkov na urýchlenie bežných úloh. Táto knižnica sa nainštaluje v predvolenom režime runtime služby Microsoft Fabric.

Pomocou devtools môžete určiť konkrétnu verziu knižnice, ktorá sa má nainštalovať. Tieto knižnice sú nainštalované v rámci všetkých uzlov v rámci klastra.

# Install a specific version. 
install_version("caesar", version = "1.0.0")

Podobne môžete nainštalovať knižnicu priamo z GitHubu.

# Install a GitHub library. 

install_github("jtilly/matchingR")

V súčasnosti sú v rámci služby Microsoft Fabric podporované nasledujúce devtools funkcie:

Príkaz Popis
install_github() Nainštaluje sa balík R z GitHubu
install_gitlab() Nainštaluje sa balík R z GitLab
install_bitbucket() Nainštaluje balík R z BitBucketu
install_url() Nainštaluje balík R z ľubovoľnej URL adresy
install_git() Nainštaluje sa z ľubovoľného odkladacieho priestoru systému git
install_local() Nainštaluje sa z lokálneho súboru na disku
install_version() Nainštaluje sa z konkrétnej verzie v sieti CRAN

Inštalácia vlastných knižníc jazyka R

Ak chcete použiť vlastnú knižnicu na úrovni relácie, musíte ju najprv nahrať do pripojeného lakehouse.

  1. Otvorte poznámkový blok, v rámci ktorému chcete použiť vlastnú knižnicu.

  2. Na ľavej strane vyberte položku Pridať a pridajte existujúce jazero alebo vytvorte jazero.

    Snímka obrazovky, ktorá znázorňuje, ako pridať do notebooku domovské jazero.

  3. Kliknite pravým tlačidlom myši alebo vyberte "..." vedľa položky Súbory a nahrajte .tar.gz súbor.

    Snímka obrazovky znázorňujúca, ako nahrať súbor do priečinka lakehouse Files.

  4. Po nahratí prejdite späť do poznámkového bloku. Pomocou nasledujúceho príkazu nainštalujte vlastnú knižnicu do relácie:

    install.packages("filepath/filename.tar.gz", repos = NULL, type = "source")
    

Zobrazenie nainštalovaných knižníc

Pomocou príkazu library dotazujte všetky knižnice nainštalované v rámci relácie.

# query all the libraries installed in current session
library()

Pomocou funkcie packageVersion skontrolujte verziu knižnice:

# check the package version
packageVersion("caesar")

Odstránenie balíka R z relácie

Ak chcete odstrániť knižnicu z priestoru názvov, môžete použiť funkciu detach. Tieto knižnice zostanú na disku, kým sa znova nenačítajú.

# detach a library

detach("package: caesar")

Ak chcete balík v rámci relácie odstrániť z poznámkového bloku, použite príkaz remove.packages(). Táto zmena knižnice nemá žiadny vplyv na iné relácie v tom istom klastri. Používatelia nemôžu odinštalovať ani odobrať vstavané knižnice predvoleného modulu runtime služby Microsoft Fabric.

Nota

Nemôžete odstrániť základné balíky, ako napríklad SparkR, SparklyR alebo R.

remove.packages("caesar")

Knižnice R v rozsahu relácií a SparkR

Knižnice v rozsahu poznámkového bloku sú k dispozícii pre pracovníkov SparkR.

install.packages("stringr")
library(SparkR)

str_length_function <- function(x) {
  library(stringr)
  str_length(x)
}

docs <- c("Wow, I really like the new light sabers!",
               "That book was excellent.",
               "R is a fantastic language.",
               "The service in this restaurant was miserable.",
               "This is neither positive or negative.")

spark.lapply(docs, str_length_function)

Knižnice R v rozsahu relácií a sparklyr

S spark_apply() v iskru môžete použiť všetky balíky R v službe Spark. Predvolene sa v sparklyr::spark_apply()argument balíkov nastaví na hodnotu FALSE. To skopíruje knižnice v súčasnej libPaths pre pracovníkov, čo vám umožní importovať a používať ich na pracovníkov. Môžete napríklad spustiť nasledovné, aby ste vygenerovali správu šifrovanú pomocou sparklyr::spark_apply():

install.packages("caesar", repos = "https://cran.microsoft.com/snapshot/2021-07-16/")

spark_version <- sparkR.version()
config <- spark_config()
sc <- spark_connect(master = "yarn", version = spark_version, spark_home = "/opt/spark", config = config)

apply_cases <- function(x) {
  library(caesar)
  caesar("hello world")
}
sdf_len(sc, 5) %>%
  spark_apply(apply_cases, packages=FALSE)

Ďalšie informácie o funkciách jazyka R: