Перенос пулов Spark из Azure Synapse Analytics в Fabric
Хотя Azure Synapse предоставляет пулы Spark, Fabric предлагает начальные пулы и настраиваемые пулы. Начальный пул может быть хорошим выбором, если у вас есть один пул без пользовательских конфигураций или библиотек в Azure Synapse, и если размер среднего узла соответствует вашим требованиям. Однако если вы ищете большую гибкость в конфигурациях пула Spark, мы рекомендуем использовать настраиваемые пулы. Ниже приведены два варианта:
- Вариант 1. Перемещение пула Spark в пул по умолчанию рабочей области.
- Вариант 2. Перемещение пула Spark в настраиваемую среду в Fabric.
Если у вас несколько пулов Spark и вы планируете переместить их в одну рабочую область Fabric, мы рекомендуем использовать вариант 2, создав несколько пользовательских сред и пулов.
Рекомендации по пулу Spark см. в различиях между Azure Synapse Spark и Fabric.
Необходимые компоненты
Если у вас еще нет, создайте рабочую область Fabric в клиенте.
Вариант 1. Из пула Spark в пул по умолчанию рабочей области
Вы можете создать настраиваемый пул Spark из рабочей области Fabric и использовать его в качестве пула по умолчанию в рабочей области. Пул по умолчанию используется всеми определениями заданий Spark и записными книжками в одной рабочей области.
Чтобы перейти из существующего пула Spark из Azure Synapse в пул рабочей области по умолчанию:
- Доступ к рабочей области Azure Synapse: вход в Azure. Перейдите в рабочую область Azure Synapse, перейдите в пулы аналитики и выберите пулы Apache Spark.
- Найдите пул Spark: из пулов Apache Spark найдите пул Spark, который требуется переместить в Fabric, и проверьте свойства пула.
- Получение свойств: получение свойств пула Spark, таких как версия Apache Spark, семейство размеров узлов, размер узла или автомасштабирование. Ознакомьтесь с рекомендациями по пулу Spark, чтобы увидеть какие-либо различия.
-
Создайте пользовательский пул Spark в Fabric:
- Перейдите в рабочую область Fabric и выберите параметры рабочей области.
- Перейдите в раздел Инжиниринг данных/Наука и выберите параметры Spark.
- На вкладке "Пул" и в разделе "Пул по умолчанию" разверните раскрывающееся меню и выберите "Создать пул".
- Создайте пользовательский пул с соответствующими целевыми значениями. Заполните имя, семейство узлов, размер узла, параметры автомасштабирования и динамического выделения исполнителя.
- Выберите версию среды выполнения:
Примечание.
В этом случае библиотеки или конфигурации уровня пула не поддерживаются. Однако вы можете настроить конфигурацию вычислений для отдельных элементов, таких как записные книжки и определения заданий Spark, и добавить встроенные библиотеки. Если необходимо добавить пользовательские библиотеки и конфигурации в среду, рассмотрите возможность пользовательской среды.
Вариант 2. Из пула Spark в настраиваемую среду
С помощью пользовательских сред можно настроить пользовательские свойства и библиотеки Spark. Чтобы создать настраиваемую среду, выполните приведенные действия.
- Доступ к рабочей области Azure Synapse: вход в Azure. Перейдите в рабочую область Azure Synapse, перейдите в пулы аналитики и выберите пулы Apache Spark.
- Найдите пул Spark: из пулов Apache Spark найдите пул Spark, который требуется переместить в Fabric, и проверьте свойства пула.
- Получение свойств: получение свойств пула Spark, таких как версия Apache Spark, семейство размеров узлов, размер узла или автомасштабирование. Ознакомьтесь с рекомендациями по пулу Spark, чтобы увидеть какие-либо различия.
-
Создайте пользовательский пул Spark:
- Перейдите в рабочую область Fabric и выберите параметры рабочей области.
- Перейдите в раздел Инжиниринг данных/Наука и выберите параметры Spark.
- На вкладке "Пул" и в разделе "Пул по умолчанию" разверните раскрывающееся меню и выберите "Создать пул".
- Создайте пользовательский пул с соответствующими целевыми значениями. Заполните имя, семейство узлов, размер узла, параметры автомасштабирования и динамического выделения исполнителя.
- Создайте элемент среды , если у вас его нет.
-
Настройка вычислений Spark:
- В среде перейдите к вычислительным вычислениям> Spark.
- Выберите только что созданный пул для новой среды.
- Вы можете настроить ядра драйверов и исполнителей и память.
- Выберите версию среды выполнения для среды. Ознакомьтесь с доступными средами выполнения.
- Нажмите кнопку "Сохранить и опубликовать изменения".
Дополнительные сведения о создании и использовании среды.