Поделиться через


Создание генеративных приложений ИИ с помощью DSPy в Azure Databricks

В этой статье описывается DSPy и приведены примеры записных книжек, демонстрирующих использование DSPy в Azure Databricks для создания и оптимизации генеративных агентов ИИ.

Что такое DSPy?

DSPy — это платформа для программного определения и оптимизации агентов создания ИИ. DSPy может автоматизировать проектирование запросов и управление тонкой настройкой LLM, чтобы повысить производительность.

DSPy состоит из нескольких компонентов, которые упрощают разработку агентов и повышают качество агента:

  • модули. В DSPy эти компоненты обрабатывают определенные преобразования текста, например ответы на вопросы или сводку. Они заменяют традиционные рукописные запросы и могут учиться на примерах, что делает их более адаптируемыми.
  • Подписи: описание на естественном языке поведения входных и выходных данных модуля. Например, "вопрос -> ответ" указывает, что модуль должен принимать вопрос в качестве входных данных и возвращать ответ.
  • компилятор: это средство оптимизации DSPy. Он улучшает конвейеры LM, изменяя модули в соответствии с метрикой производительности, либо создавая лучшие подсказки, либо производя точную настройку моделей.
  • Программа (DSPy): набор модулей, объединённых в цепочку для выполнения сложных задач. Программы DSPy являются гибкими, что позволяет оптимизировать и адаптировать их с помощью компилятора.

Создание программы DSPy для классификатора текста

В следующей записной книжке показано, как создать программу DSPy, которая выполняет классификацию текста. В этом примере показано, как работает DSPy и компоненты, которые он использует.

Создание программного блокнота DSPy для текстового классификатора

Возьмите записную книжку

Создание программы DSPy для RAG

В этих записных книжках показано, как с помощью DSPy создать и оптимизировать базовую программу RAG. Предполагается, что в этих записных книжках вы используете бессерверные вычисления, и они устанавливают пакеты на уровне записной книжки, чтобы обеспечить их выполнение независимо от версии среды выполнения Databricks.

Часть 1. Подготовка индекса данных и векторного поиска для записной книжки программы RAG DSPy

Возьмите записную книжку

Часть 2: Создание и оптимизация программы DSPy для блокнота RAG

Возьми записную книжку

Миграция LangChain в DSPy

Эти записные книжки показывают, как перенести код модели LangChain в DSPy и оптимизировать его для повышения производительности. Предполагается, что в этих записных книжках вы используете бессерверные вычисления, и они устанавливают пакеты на уровне записной книжки, чтобы обеспечить их выполнение независимо от версии среды выполнения Databricks.

Перенос кода модели LangChain в записную книжку DSPy

Возьми записную книжку

Оптимизируйте перенесенную записную книжку модели DSPy

Возьмите записную книжку