Бөлісу құралы:


Миграция из фабрики данных Azure в фабрику данных в Microsoft Fabric

Эта статья предназначена для создателей конвейера Azure Data Factory и Synapse 2-го поколения. Он предоставляет рекомендации и обоснование для модернизации и переноса конвейеров в фабрику данных для Microsoft Fabric.

Контекст

Microsoft Fabric — это интегрированная платформа для корпоративных данных, управляемых самообслуживанием и ИТ-управлением. Благодаря экспоненциальному росту объемов данных и сложности клиенты Fabric требуют корпоративных решений, которые масштабируются, являются безопасными, простыми и доступными для всех пользователей в крупнейших организациях.

В последние годы корпорация Майкрософт инвестировала значительную работу по доставке масштабируемых облачных возможностей клиентам. В этом случае Фабрика данных в Fabric предоставляет большую экосистему разработчиков интеграции данных и решений интеграции данных, созданных на протяжении десятилетий, для использования полного набора функций и возможностей, которые выходят за рамки сопоставимых функциональных возможностей, доступных в предыдущих поколениях.

Естественно, клиенты спрашивают, есть ли возможность консолидироваться, размещая свои решения интеграции данных в Fabric. Они часто задают такие вопросы:

  • Все ли функциональные возможности, на которые мы полагаемся, работают в конвейерах Fabric?
  • Какие возможности доступны только в конвейерах Fabric?
  • Как перенести существующие конвейеры в конвейеры Fabric?
  • Что такое стратегия приема корпоративных данных майкрософт?

Ответы на многие из этих вопросов описаны в этой статье.

Заметка

Решение о переходе на емкости Fabric зависит от требований каждого клиента. Клиенты должны тщательно оценивать другие преимущества, чтобы принять информированное решение. Мы ожидаем, что органическая миграция на конвейеры Fabric произойдет со временем, и наше намерение заключается в том, чтобы это происходило на условиях, которые устраивают каждого клиента.

Для ясности, в настоящее время нет никаких планов по выведению из эксплуатации Azure Data Factory или Synapse Gen2 для приема данных. Существует приоритет, чтобы сосредоточиться на инвестициях в конвейеры Fabric для приема корпоративных данных, и поэтому дополнительная ценность, предоставляемая емкостями Fabric, будет увеличиваться с течением времени. Клиенты, которые выбирают емкости Fabric, могут ожидать преимущества от согласования с планом развития продуктов Microsoft Fabric.

Конвергенция интеграции корпоративных и самообслуживания данных

Консолидация элементов в Fabric упрощает обнаружение, совместную работу и управление путем сосредоточения ресурсов. Это позволяет центральным ИТ-группам выполнять операции критически важных служб перемещения и преобразования данных, согласованных с корпоративными стандартами, включая происхождение данных и мониторинг, а также более легко интегрировать популярные элементы самообслуживания.

Для поддержки совместных и масштабируемых потребностей организаций конвейеры Fabric представляют действия Office 365 и Teams для отправки сообщений, простого обновления семантических моделей Power BI и надежных функций управления, помогая организациям управлять происхождением данных и мониторингом конвейеров. Интеграция генерируемого искусственного интеллекта с помощью Copilot расширяет возможности конвейера, предлагая интеллектуальные объяснения создания и устранения ошибок, упрощая создание и управление сложными решениями.

Используя общую платформу, рабочий процесс упрощается, повышая разработку решений между бизнесом и ИТ. Это позволяет организациям масштабировать свои решения данных на корпоративных уровнях, обеспечивая высокую производительность, гибкость и эффективность управления большими объемами данных.

Емкости Ткани

Благодаря распределенной архитектуре емкости Fabric менее чувствительны к общей нагрузке, временным пикам и высокой параллелизме. Благодаря консолидации емкостей в более крупные размеры SKU Fabric клиенты могут повысить производительность и пропускную способность.

Сравнение функций

В следующей таблице перечислены функции, поддерживаемые фабрикой данных Azure и фабрикой данных Fabric.

Особенность Фабрика данных Azure Фабрика данных Fabric
действия конвейера
Office 365 и действия в Teams позволяют легко отправлять сообщения, упрощая эффективное взаимодействие и совместную работу в вашей организации. Нет Да
Создайте подключения к семантической модели Power BI и потоку данных 2-го поколения , чтобы обеспечить согласованное обновление данных и их актуальность up-to. Нет Да
Валидация в конвейере, чтобы гарантировать, что конвейер продолжает выполнение только после проверки наличия ссылки на подключенный набор данных, соответствия указанным критериям или истечения тайм-аута. Да Да1
Запустите пакет SQL Server Integration Services (SSIS) для выполнения операций интеграции и преобразования данных. Да Запланированный
преобразование данных
Визуально проектируйте преобразования данных, используя кластеры Apache Spark и Mapping Dataflows для создания и управления процессами преобразования данных через графический интерфейс. Да Нет2
Визуальные преобразования данных с использованием вычислительной системы Fabric и интуитивно понятного графического интерфейса Power Query в потоке данных второго поколения. Нет Да
подключение
Поддержка всех источников данных фабрики данных Да Выполняется3
масштабируемость
Обеспечьте беспрепятственное выполнение действий в потоке обработки с запланированными запусками Да Да
Планирование нескольких запусков для одного конвейера для гибкого и эффективного управления конвейерами Да запланировано
Использование триггеров переворачивающегося окна для планирования запусков конвейера в отдельных неперекрывающихся временных окнах Да запланировано
Триггеры событий для автоматизации выполнения конвейера в ответ на конкретные или соответствующие события Да Да4
Искусственный интеллект
Copilot для фабрики данных, которая обеспечивает интеллектуальное создание конвейера для приема данных с легкостью и объяснениями, чтобы лучше понять сложные конвейеры или предоставить предложения для сообщений об ошибках Нет Да
управление содержимым
вид происхождения данных, который помогает пользователям понять и оценить зависимости потока данных. Нет Да
цепочки развертывания, которые управляют жизненным циклом содержимого Нет Да
масштабируемость платформы и устойчивость
архитектура Premium-емкости, которая поддерживает увеличение масштаба и производительности. Нет Да
поддержка нескольких регионов, которая помогает многонациональным клиентам решать региональные, отраслевые или организационные требования к месту размещения данных Да Да
Безопасность
шлюз данных виртуальной сети (виртуальная сеть) подключения, что позволяет Fabric легко работать в виртуальной сети организации. Нет запланировано
локального шлюза данных подключения, что обеспечивает безопасный доступ к данным между локальными источниками данных организации и элементами Fabric. Нет Да
Поддержка тегов службы Azure, которая является определенной группой IP-адресов, которая автоматически управляется, чтобы свести к минимуму сложность обновлений или изменений в правилах безопасности сети. Да Да
управления
Содержимое подтверждения, для продвижения или сертификации ценных, высококачественных элементов Fabric Нет Да
интеграции Microsoft Purview, которая помогает клиентам управлять и контролировать элементы Fabric Да Да
Метки конфиденциальности Microsoft Information Protection (MIP) и их интеграция с Microsoft Defender для облачных приложений для предотвращения утечки данных. Нет Да
Мониторинг и диагностическое ведение журналов
Ведение журнала событий выполнения конвейера в хранилище событий для мониторинга, анализа и устранения неполадок производительности конвейера Да Запланированный
концентратор мониторинга, который предоставляет возможности мониторинга для элементов системы Fabric Нет Да
приложения метрик емкости Microsoft Fabric, которое обеспечивает возможности мониторинга емкостей Fabric Нет Да
журнал аудита, который отслеживает действия пользователей в Fabric и Microsoft 365 Нет Да

1 Используйте Получить метаданные, До тех пор, пока и Если условие активности для извлечения эквивалентных метаданных активности валидации.

2 Используйте функцию вызова удаленного конвейера для выполнения активностей потока данных сопоставления, см. активность Invoke Pipeline.

3 Чтобы просмотреть соединители, которые в настоящее время поддерживаются для конвейеров данных, см. Поддержка конвейеров.

4 Используйте Fabric eventstreams и Reflex для запуска событий выполнения, см. триггеры событий конвейера.

Соображения

Перед переносом в конвейеры Fabric необходимо учитывать некоторые другие факторы, которые следует учитывать при планировании.

Лицензирование

Конвейеры Fabric требуют как минимум лицензии Microsoft Fabric (бесплатно) для создания в рабочей области с емкостью премиум-класса. Чтобы узнать больше, обратитесь к лицензиям Fabric.

Стратегия

Документация по плану выпуска Microsoft Fabric сообщает о последнем обновлении и временных рамках для клиентов по мере подготовки функций для будущих выпусков, включая нововведения и запланированные изменения в Data Factory в Microsoft Fabric.

Для получения дополнительной информации см. документацию по плану выпуска Microsoft Fabric.

Узнайте, как спланировать миграцию данных ADF в среду Fabric Data Factory.