Создание генеративных приложений ИИ с помощью DSPy в Azure Databricks
В этой статье описывается DSPy и приведены примеры записных книжек, демонстрирующих использование DSPy в Azure Databricks для создания и оптимизации генеративных агентов ИИ.
Что такое DSPy?
DSPy — это платформа для программного определения и оптимизации агентов создания ИИ. DSPy может автоматизировать проектирование запросов и управление тонкой настройкой LLM, чтобы повысить производительность.
DSPy состоит из нескольких компонентов, которые упрощают разработку агентов и повышают качество агента:
- модули. В DSPy эти компоненты обрабатывают определенные преобразования текста, например ответы на вопросы или сводку. Они заменяют традиционные рукописные запросы и могут учиться на примерах, что делает их более адаптируемыми.
- Подписи: описание на естественном языке поведения входных и выходных данных модуля. Например, "вопрос -> ответ" указывает, что модуль должен принимать вопрос в качестве входных данных и возвращать ответ.
- компилятор: это средство оптимизации DSPy. Он улучшает конвейеры LM, изменяя модули в соответствии с метрикой производительности, либо создавая лучшие подсказки, либо производя точную настройку моделей.
- Программа (DSPy): набор модулей, объединённых в цепочку для выполнения сложных задач. Программы DSPy являются гибкими, что позволяет оптимизировать и адаптировать их с помощью компилятора.
Создание программы DSPy для классификатора текста
В следующей записной книжке показано, как создать программу DSPy, которая выполняет классификацию текста. В этом примере показано, как работает DSPy и компоненты, которые он использует.
Создание программного блокнота DSPy для текстового классификатора
Создание программы DSPy для RAG
В этих записных книжках показано, как с помощью DSPy создать и оптимизировать базовую программу RAG. Предполагается, что в этих записных книжках вы используете бессерверные вычисления, и они устанавливают пакеты на уровне записной книжки, чтобы обеспечить их выполнение независимо от версии среды выполнения Databricks.
Часть 1. Подготовка индекса данных и векторного поиска для записной книжки программы RAG DSPy
Часть 2: Создание и оптимизация программы DSPy для блокнота RAG
Миграция LangChain в DSPy
Эти записные книжки показывают, как перенести код модели LangChain в DSPy и оптимизировать его для повышения производительности. Предполагается, что в этих записных книжках вы используете бессерверные вычисления, и они устанавливают пакеты на уровне записной книжки, чтобы обеспечить их выполнение независимо от версии среды выполнения Databricks.