Databricks 上的大型語言模型 (LLM)
Azure Databricks 可讓您輕鬆地存取及建置公開可用的大型語言模型。
適用於 機器學習 的 Databricks Runtime 包含 Hugging Face Transformers 和 LangChain 等連結庫,可讓您將現有的預先定型模型或其他開放原始碼連結庫整合到工作流程中。 您可以從這裡利用 Azure Databricks 平臺功能來用您自己的數據微調 LLM,以提升領域效能。
此外,Azure Databricks 還提供內建功能,讓 SQL 用戶能夠使用 AI 函式來存取和實驗 LLM,例如 Azure OpenAI 和 OpenAI。
基礎模型微調
重要
這項功能處於公開預覽狀態。 請連絡 Databricks 帳戶小組,以註冊公開預覽版。
基礎模型微調(現在是馬賽克 AI 模型訓練的一部分)是 Databricks 訓練堆疊的簡單介面,可執行完整的模型微調。
您可以使用基礎模型微調來執行下列動作:
- 使用自定義數據微調模型,並將檢查點儲存至 MLflow。 您可以保留微調模型的完整控制權。
- 自動將模型註冊至 Unity 目錄,以方便使用模型服務進行部署。
- 藉由載入先前微調過的模型的權重,對已完成的專屬模型進行微調。
請參閱 基礎模型微調。
Hugging Face Transformers(Hugging Face 的變形金剛模型)
透過 Databricks 上的 Hugging Face Transformers,您可以擴展自然語言處理 (NLP) 批次應用程式,並微調大型語言模型應用。
Hugging Face transformers
程式庫已預安裝在 Databricks Runtime 10.4 LTS ML 及更高版本。 許多熱門的 NLP 模型在 GPU 硬體上效果最佳,因此,除非您使用特別針對 CPU 使用優化的模型,否則您可能會使用最新的 GPU 硬體獲得最佳效能。
DSPy
DSPy 會將使用者定義的自然語言簽章轉譯成完整的指示和少量範例,以自動化調整提示。
如需如何使用 DSPy 的範例,請參閱在 Azure Databricks 上使用 DSPy 建置產生的 AI 應用程式。
LangChain
LangChain 可用作實驗性 MLflow 變體,讓 LangChain 客戶可以直接從 Azure Databricks 環境利用 MLflow 的強固工具和實驗追蹤功能。
LangChain 是一種軟體架構,旨在協助建立利用大型語言模型 (LLM) 的應用程式,並將其與外部數據結合,為您的 LLM 帶來更多的定型內容。
Databricks Runtime ML 在 Databricks Runtime 13.1 ML 和更新版本中包含 langchain
。
瞭解 Databricks 專用的 LangChain 集成。
AI 功能
重要
這項功能處於公開預覽狀態。
AI 函 式是內建的 SQL 函式,可讓 SQL 使用者:
- 使用 Databricks Foundation 模型 API 來完成公司數據的各種工作。
- 從 OpenAI 存取 GPT-4 之類的外部模型,並加以實驗。
- 由馬賽克 AI 模型裝載的查詢模型從 SQL 查詢提供端點。