2019. června
Tyto funkce a vylepšení platformy Azure Databricks byly vydány v červnu 2019.
Poznámka:
Verze jsou připraveny. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.
Podpora instance Lsv2 je obecně dostupná
24. června – 26. června 2019: Verze 2.100
Azure Databricks teď poskytuje plnou podporu pro řadu virtuálních počítačů Lsv2 pro úlohy s vysokou propustností a vysokým počtem IOPS.
Integrace softwaru RStudio se už neomezuje na clustery s vysokou souběžností
6. června – 11. června 2019: Verze 2.99
Teď můžete RStudio Server povolit na standardních clusterech v Azure Databricks, kromě clusterů s vysokou souběžností, které už byly podporované. Integrace RStudio Serveru bez ohledu na režim clusteru nadále vyžaduje, abyste zakázali možnost automatického ukončení clusteru. Viz RStudio v Azure Databricks.
MLflow 1.0
3. června 2019
MLflow je opensourcová platforma pro správu celého životního cyklu strojového učení. S MLflow můžou datoví vědci sledovat a sdílet experimenty místně nebo v cloudu, zabalit a sdílet modely napříč architekturami a nasazovat modely prakticky kdekoli.
S radostí oznamujeme vydání MLflow 1.0 dnes. Verze 1.0 nejen označuje vyspělost a stabilitu rozhraní API, ale také přidává řadu často požadovaných funkcí a vylepšení:
- Rozhraní příkazového řádku bylo znovu uspořádané a teď obsahuje vyhrazené příkazy pro artefakty, modely, databázi (sledovací databázi) a server (sledovací server).
- Vyhledávání na sledovacím serveru podporuje zjednodušenou verzi
SQL WHERE
klauzule. Kromě podpory metrik spuštění a parametrů bylo vyhledávání vylepšeno tak, aby podporovalo některé atributy spuštění a značky uživatelů a systémů. - Přidá podporu souřadnic x v rozhraní API pro sledování. Komponenty vizualizace uživatelského rozhraní MLflow nyní také podporují vykreslení metrik s poskytnutými souřadnicemi x values.
- Přidá koncový bod rozhraní REST API
runs/log-batch
a také metody Pythonu, R a Javy pro protokolování více metrik, parametersa značek s jedním požadavkem rozhraní API. - Ke sledování se teď ve Windows podporuje klient MLflow 1.0.
- Přidává podporu HDFS jako back-end úložiště artefaktů.
- Přidá příkaz pro sestavení kontejneru Dockeru, jehož výchozí vstupní bod slouží zadanému modelu funkcí Pythonu MLflow na portu 8080 v kontejneru.
- Přidá experimentální příchuť modelu ONNX .
Úplný list změn můžete zobrazit v protokolu změn MLflow .
Databricks Runtime 5.4 pro strojové učení
3. června 2019
Databricks Runtime 5.4 ML je postaven na Databricks Runtime 5.4 (EoS). Obsahuje mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch, Keras a XGBoost a poskytuje distribuované trénování TensorFlow pomocí Horovodu.
Obsahuje následující nové funkce:
- Integrace knihovny MLlib s MLflow (Public Preview)
- Hyperopt s předinstalovanou třídou SparkTrials (Public Preview).
- Výstup HorovodRunneru odeslaný z Horovodu do uzlu ovladače Spark je teď viditelný v buňkách poznámkového bloku.
- Předinstalovaný balíček XGBoost Pythonu
Podrobnosti najdete v tématu Databricks Runtime 5.4 pro ML (EoS).
Databricks Runtime 5.4
3. června 2019
Databricks Runtime 5.4 je teď k dispozici. Databricks Runtime 5.4 zahrnuje Apache Spark 2.4.2, upgradované knihovny Pythonu, R, Javy a Scala a následující nové funkce:
- Delta Lake v Databricks přidává automatické Optimize (Veřejná ukázka)
- Použití oblíbeného integrovaného vývojového prostředí (IDE) a serveru poznámkového bloku s Databricks Connect
- Obecně dostupné nástroje knihovny
- Binární zdroj dat souboru
Podrobnosti najdete v tématu Databricks Runtime 5.4 (EoS).