Sdílet prostřednictvím


duben 2019

Tyto funkce a vylepšení platformy Azure Databricks byly vydány v dubnu 2019.

Poznámka:

Verze jsou postupně zaváděny. Váš účet Azure Databricks se nemusí aktualizovat až do týdne po počátečním datu vydání.

MLflow v Azure Databricks (obecná dostupnost)

25. dubna 2019

Spravovaný MLflow v Azure Databricks je teď obecně dostupný. MLflow v Azure Databricks nabízí hostované verze MLflow plně integrované s modelem zabezpečení Databricks a interaktivním pracovním prostorem. Viz MLflow pro agenta generativní AI a životní cyklus modelu ML.

Delta Lake na Azure Databricks

24. dubna 2019

Databricks má opensourcový projekt Delta Lake . Delta Lake je vrstva úložiště, která zajišťuje spolehlivost datových jezer postavených na HDFS a cloudových úložištích tím, že umožňuje transakce ACID prostřednictvím optimistického řízení souběžnosti a izolace snímků, což zajišťuje konzistentní čtení během zápisů. Delta Lake také poskytuje integrovanou správu verzí dat pro snadné vrácení zpět a reprodukci sestav.

Poznámka:

To, co se dříve jmenovalo Databricks Delta, je teď open-sourceový projekt Delta Lake a optimalizace dostupné na platformě Azure Databricks. Podívejte se, co je Delta Lake?

MLflow spustí boční panel

9. dubna – 16. dubna 2019: Verze 2.95

Teď můžete na bočním panelu vedle svého poznámkového bloku zobrazit běhy MLflow a revize poznámkového bloku, které vedly k těmto běhům. Na pravém bočním panelu poznámkového bloku klikněte na ikonu Experiment.

Podívej se na Vytvoření experimentu poznámkového bloku.

Přístup k Azure Data Lake Storage Gen1 a Gen2 automaticky pomocí přihlašovacích údajů Microsoft Entra ID (GA)

9.–16. dubna 2019: Verze 2.95

S radostí oznamujeme obecnou dostupnost automatického ověřování pro Azure Data Lake Storage Gen1 a Gen2 z clusterů Azure Databricks pomocí stejné identity Microsoft Entra ID, kterou používáte pro přihlášení k Azure Databricks.

Jednoduše povolte cluster pro předávání přihlašovacích údajů Microsoft Entra ID a příkazy, které v daném clusteru spustíte, budou moct číst a zapisovat data v Azure Data Lake Storage Gen1 a Gen2, aniž byste museli nakonfigurovat přihlašovací údaje instančního objektu pro přístup k úložišti.

Další informace najdete v tématu Přístup ke službě Azure Data Lake Storage pomocí předávání přihlašovacích údajů Microsoft Entra ID (starší verze).

Databricks Runtime 5.3 (obecná dostupnost)

3. dubna 2019

Databricks Runtime 5.3 je teď obecně dostupný. Databricks Runtime 5.3 obsahuje nové funkce a upgrady Delta Lake a upgradované knihovny Pythonu, R, Javy a Scala.

Mezi hlavní upgrady patří:

  • cs-CZ: Časové cestování s Databricks Delta obecně dostupné
  • Replikace tabulek MySQL do Delta, Public Preview
  • Optimalizovaná složka DBFS FUSE pro úlohy hlubokého učení
  • Vylepšení knihovny s vymezeným poznámkovým blokem
  • Nové tipy od Databricks Advisor

Podrobnosti najdete v tématu Databricks Runtime 5.3 (EoS).

Databricks Runtime 5.3 ML (obecná dostupnost)

3. dubna 2019

S Databricks Runtime 5.3 pro strojové učení jsme dosáhli naší první GA Databricks Runtime ML! Databricks Runtime ML poskytuje připravené prostředí pro strojové učení a datové vědy. Staví na Databricks Runtime a přidává mnoho oblíbených knihoven strojového učení, včetně TensorFlow, PyTorch, Keras a XGBoost. Podporuje také distribuované trénování s využitím Horovodu.

Tato verze je založená na modulu Databricks Runtime 5.3 s dalšími knihovnami, několika různými verzemi knihoven a správou balíčků Conda pro knihovny Pythonu. Mezi hlavní nové funkce od databricks Runtime 5.2 ML Beta patří:

  • Integrace MLlib s MLflow (soukromý náhled), která poskytuje automatické protokolování MLflow pro modely trénované pomocí algoritmů ladění PySpark CrossValidator a TrainValidationSplit.

    Pokud se chcete zúčastnit náhledové verze, obraťte se na váš tým účtu Databricks.

  • Aktualizace knihoven PyArrow, Horovod a TensorboardX.

    Aktualizace PyArrow přidává možnost používat BinaryType při provádění převodu založeného na knihovně Arrow a zpřístupňuje ho v pandas UDF.

Další informace najdete v tématu Databricks Runtime 5.3 ML (EoS). Pokyny k vytvoření clusteru Databricks Runtime ML najdete v tématu AI a strojové učení v Databricks.