Бөлісу құралы:


Получение данных из Amazon S3

В этой статье вы узнаете, как получить данные из Amazon S3 в новую или существующую таблицу. Amazon S3 — это служба хранилища объектов, созданная для хранения и извлечения данных.

Дополнительные сведения об Amazon S3 см. в статье Что такое Amazon S3?.

Необходимые условия

Источник

  1. На нижней ленте базы данных KQL выберите Получить данные.

    В окне Получение данных выбрана вкладка Источник.

  2. Выберите источник данных из доступного списка. В этом примере вы получаете данные из Amazon S3.

    снимок экрана: окно получения данных с выбранной вкладкой источника.

Настроить

  1. Выберите целевую таблицу. Если вы хотите получать данные в новую таблицу, выберите +Создать таблицу и введите имя таблицы.

    Заметка

    Имена таблиц могут содержать до 1024 символов, включая пробелы, буквенно-цифровые символы, дефисы и символы подчеркивания. Специальные символы не поддерживаются.

  2. В поле URI вставьте строку подключения одного контейнера или отдельный объект в следующем формате.

    Контейнер: https://BucketName.s3.RegionName.amazonaws.com;AwsCredentials=AwsAccessID,AwsSecretKey

    При необходимости можно применить фильтры контейнеров для фильтрации данных в соответствии с определенным расширением файла.

    снимок экрана: вкладка

  3. Выберите Далее.

Проверять

Откроется вкладка "Проверка" с предварительным просмотром данных.

Чтобы завершить процесс приема, нажмите кнопку Готово.

снимок экрана вкладки

Необязательно:

Изменение столбцов

Заметка

  • Для табличных форматов (CSV, TSV, PSV) невозможно сопоставить столбец дважды. Чтобы сопоставить с существующим столбцом, сначала удалите новый столбец.
  • Невозможно изменить существующий тип столбца. Если вы попытаетесь сопоставить со столбцом другого формата, это может привести к пустым столбцам.

Изменения, которые можно внести в таблицу, зависят от следующих параметров:

  • тип таблицы является новым или существующим
  • тип сопоставления является новым или существующим
Тип таблицы Тип сопоставления Доступные корректировки
Новая таблица Новое сопоставление Переименовать столбец, изменить тип данных, изменить источник данных, преобразование сопоставления, добавить столбец, удалить столбец
Существующая таблица Новое картирование Добавьте столбец (в котором можно изменить тип данных, переименовать и обновить)
Существующая таблица Существующее сопоставление никакой

снимок экрана: столбцы, открытые для редактирования.

Преобразования отображений

Некоторые сопоставления форматов данных (Parquet, JSON и Avro) поддерживают простые преобразования при загрузке данных. Чтобы применить преобразования сопоставления, создайте или обновите столбец в окне Редактирование столбцов.

Преобразования отображения можно выполнять для столбца с типом данных string или datetime, когда у источника тип данных int или long. Поддерживаемые сопоставительные преобразования:

  • ДатаВремяИзUnixСекунд
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • ДатаВремяИзUnixНаносекунд

Дополнительные параметры на основе типа данных

табличный (CSV, TSV, PSV):

  • Если вы используете табличные форматы в существующей таблице, можно выбрать Дополнительные>Сохранение схемы таблицы. Табличные данные не обязательно включают имена столбцов, которые используются для сопоставления исходных данных с существующими столбцами. При проверке этого параметра сопоставление выполняется по порядку, а схема таблицы остается той же. Если этот параметр снят, для входящих данных создаются новые столбцы независимо от структуры данных.

  • Чтобы использовать первую строку в качестве имен столбцов, выберите Advanced>Первая строка является заголовком столбца.

    снимок экрана с расширенными параметрами CSV.

JSON:

  • Чтобы определить деление данных JSON, выберите Расширенные>вложенные уровниот 1 до 100.

  • Если выбрать Advanced>Skip JSON lines with errors, данные будут приниматься в формате JSON. Если этот флажок не выбран, данные будут получены в формате multijson.

    снимок экрана с расширенными параметрами JSON.

Сводка

В окне подготовки данных все три шага помечаются зелеными галочками, когда прием данных завершается успешно. Вы можете выбрать карточку для запроса, удалить загруженные данные или просмотреть панель мониторинга сводки ингерсации.

снимок экрана страницы сводки, где прием данных успешно завершен.