Tutorial: Ingerir dados em um repositório
Aplica-se a:✅Warehouse no Microsoft Fabric
Neste tutorial, saiba como ingerir dados do Armazenamento do Microsoft Azure em um Warehouse para criar tabelas.
Nota
Este tutorial faz parte de um cenário de ponta a ponta. Para concluir este tutorial, primeiro você deve concluir estes tutoriais:
Ingestão de dados
Nesta tarefa, saiba como ingerir dados no warehouse para criar tabelas.
Verifique se o workspace que você criou no primeiro tutorial está aberto.
No painel inicial do workspace, selecione + Novo Item para exibir a lista completa de tipos de itens disponíveis.
Na lista, na seção Obter dados, selecione o tipo de item Pipeline de dados.
Na janela Novo pipeline, na caixa Nome, insira
Load Customer Data
.Para provisionar o pipeline, selecione Criar. O provisionamento é concluído quando aparece a página de destino "Construir um pipeline de dados" ().
Na página de aterrissagem do pipeline de dados, selecione Atividade do pipeline.
No menu, de dentro da seção Mover e transformar, selecione Copiar dados.
Na tela de design do pipeline, selecione a atividade Copiar dados.
Para configurar a atividade, na página Geral, na caixa Nome, substitua o texto padrão por
CD Load dimension_customer
.Na página Origem, na lista suspensa Conexão, selecione Mais para revelar todas as fontes de dados que você pode escolher, incluindo fontes de dados no catálogo do OneLake.
Selecione + Novo para criar uma nova fonte de dados.
Pesquise e selecione Blobs do Azure.
Na página Fonte de dados do Connect, na caixa Nome ou URL da conta, insira
https://fabrictutorialdata.blob.core.windows.net/sampledata/
.Observe que a lista suspensa do Nome da conexão é preenchida automaticamente, e que o tipo de autenticação está definido como Anônimo.
Selecione Conectar.
Na página Origem, para acessar os arquivos Parquet na fonte de dados, realize as seguintes configurações:
Nas caixas Caminho do arquivo, insira:
Caminho do arquivo – Contêiner:
sampledata
Caminho do arquivo - Diretório:
WideWorldImportersDW/tables
Caminho do arquivo - Nome do arquivo:
dimension_customer.parquet
Na lista suspensa Formato de arquivo, selecione Parquet.
Para visualizar os dados e testar se não há erros, selecione Visualizar dados.
Na página Destino, na lista suspensa Conexão, selecione o repositório
Wide World Importers
.Para Opção de tabela, selecione a opção Criar tabela automaticamente.
Na primeira caixa Tabela, insira
dbo
.Na segunda caixa, insira
dimension_customer
.Faixa de opções Página Inicial, selecione Executar.
Na caixa de diálogo Salvar e executar?, selecione Salvar e executar para que o pipeline carregue a tabela
dimension_customer
.Para monitorar o progresso da atividade Copy, revise as atividades de execução de pipeline na página Saída (aguarde até que seja concluída com o status de Êxito).