Velké jazykové modely (LLM) v Databricks

Článek
03/11/2025

Azure Databricks usnadňuje přístup k veřejně dostupným velkým jazykovým modelům a umožňuje ho vytvářet.

Databricks Runtime pro Machine Learning zahrnuje knihovny, jako je Hugging Face Transformers a LangChain, které umožňují integrovat existující předem natrénované modely nebo jiné opensourcové knihovny do pracovního postupu. Odtud můžete využít funkce platformy Azure Databricks k vyladění LLM pomocí vlastních dat pro lepší výkon domény.

Kromě toho Azure Databricks nabízí uživatelům SQL integrované funkce pro přístup a experimentování s LLM, jako je Azure OpenAI a OpenAI, pomocí AI funkcí.

Vyladění základního modelu

Důležité

Tato funkce je ve verzi Public Preview. Spojte se s týmem účtu Databricks a zaregistrujte se do verze Public Preview.

Vyladění základního modelu (nyní součástí školení modelů Mosaic AI) je jednoduché rozhraní ke školicí infrastruktuře Databricks, které umožňuje provádět kompletní vyladění modelu.

Pomocí jemného ladění základního modelu můžete provést následující akce:

Dolaďte model vlastními daty s kontrolními body uloženými do MLflow. Zachováte si úplnou kontrolu nad jemně vyladěným modelem.
Automaticky zaregistrujte model do Unity Catalog, což umožňuje snadné nasazení a poskytování modelu.
Dolaďte dokončený, proprietární model načtením hmotností dříve jemně vyladěného modelu.

Viz vyladění základního modelu.

Hugging Face Transformers

Díky Hugging Face Transformers na Databricks můžete škálovat dávkové aplikace pro zpracování přirozeného jazyka (NLP) a doladit modely pro aplikace velkých jazykových modelů.

Knihovna Hugging Face transformers je předinstalovaná na Databricks Runtime 10.4 LTS ML a vyšší. Mnohé z oblíbených modelů NLP fungují nejlépe na hardwaru GPU, takže pokud nepoužíváte model optimalizovaný pro použití na procesorech, můžete dosáhnout nejlepšího výkonu pomocí nejnovějšího hardwaru GPU.

DSPy

DSPy automatizuje ladění prompt překladem uživatelsky definovaných jazykových vzorů do kompletních pokynů a malého množství příkladů.

Příklady použití DSPy najdete v tématu Vytváření generování aplikací umělé inteligence využívajících DSPy v Azure Databricks.

LangChain

LangChain je k dispozici jako experimentální varianta MLflow, která zákazníkům LangChain umožňuje využívat robustní nástroje a možnosti sledování experimentů MLflow přímo z prostředí Azure Databricks.

LangChain je softwarová architektura navržená tak, aby pomáhala vytvářet aplikace, které využívají velké jazykové modely (LLM) a kombinují je s externími daty, aby přinesly více trénovacího kontextu pro vaše LLM.

Databricks Runtime ML zahrnuje langchain v Databricks Runtime 13.1 ML a vyšší.

Zjistěte více o integracích LangChain specifických pro Databricks.

Funkce AI

Důležité

Tato funkce je ve verzi Public Preview.

Funkce AI jsou integrované funkce SQL, které uživatelům SQL umožňují:

Pomocí rozhraní API modelu Foundation Databricks můžete provádět různé úkoly s daty vaší společnosti.
Získejte přístup k externím modelům, jako je GPT-4, z OpenAI a experimentujte s nimi.
Dotazy na modely hostované pomocí architektury Mosaic AI Model Obsluhující koncové body z dotazů SQL

Sdílet prostřednictvím