Compartilhar via


Tutorial: Ingerir dados em um repositório

Aplica-se a:✅Warehouse no Microsoft Fabric

Neste tutorial, saiba como ingerir dados do Armazenamento do Microsoft Azure em um Warehouse para criar tabelas.

Nota

Este tutorial faz parte de um cenário de ponta a ponta. Para concluir este tutorial, primeiro você deve concluir estes tutoriais:

  1. Criar um espaço de trabalho
  2. Criar um repositório

Ingestão de dados

Nesta tarefa, saiba como ingerir dados no warehouse para criar tabelas.

  1. Verifique se o workspace que você criou no primeiro tutorial está aberto.

  2. No painel inicial do workspace, selecione + Novo Item para exibir a lista completa de tipos de itens disponíveis.

  3. Na lista, na seção Obter dados, selecione o tipo de item Pipeline de dados.

  4. Na janela Novo pipeline, na caixa Nome, insira Load Customer Data.

    Captura de tela da caixa de diálogo Novo pipeline, realçando o nome inserido.

  5. Para provisionar o pipeline, selecione Criar. O provisionamento é concluído quando aparece a página de destino "Construir um pipeline de dados" ().

  6. Na página de aterrissagem do pipeline de dados, selecione Atividade do pipeline.

    Captura de tela da página de aterrissagem Criar um pipeline de dados, realçando a opção Atividade pipeline.

  7. No menu, de dentro da seção Mover e transformar, selecione Copiar dados.

    Captura de tela da seção Mover e transformar, mostrando onde selecionar Copiar dados.

  8. Na tela de design do pipeline, selecione a atividade Copiar dados.

    Captura de tela de Copiar dados na tela de design.

  9. Para configurar a atividade, na página Geral, na caixa Nome, substitua o texto padrão por CD Load dimension_customer.

    Captura de tela da guia Geral, mostrando onde inserir o nome da atividade de cópia.

  10. Na página Origem, na lista suspensa Conexão, selecione Mais para revelar todas as fontes de dados que você pode escolher, incluindo fontes de dados no catálogo do OneLake.

  11. Selecione + Novo para criar uma nova fonte de dados.

  12. Pesquise e selecione Blobs do Azure.

  13. Na página Fonte de dados do Connect, na caixa Nome ou URL da conta, insira https://fabrictutorialdata.blob.core.windows.net/sampledata/.

  14. Observe que a lista suspensa do Nome da conexão é preenchida automaticamente, e que o tipo de autenticação está definido como Anônimo.

    Captura de tela da janela Conectar à fonte de dados mostrando todas as configurações concluídas.

  15. Selecione Conectar.

  16. Na página Origem, para acessar os arquivos Parquet na fonte de dados, realize as seguintes configurações:

    1. Nas caixas Caminho do arquivo, insira:

      1. Caminho do arquivo – Contêiner:sampledata

      2. Caminho do arquivo - Diretório:WideWorldImportersDW/tables

      3. Caminho do arquivo - Nome do arquivo:dimension_customer.parquet

    2. Na lista suspensa Formato de arquivo, selecione Parquet.

  17. Para visualizar os dados e testar se não há erros, selecione Visualizar dados.

    Captura de tela da página fonte, destacando as alterações feitas nas etapas anteriores e a função de visualização de dados.

  18. Na página Destino, na lista suspensa Conexão, selecione o repositório Wide World Importers.

  19. Para Opção de tabela, selecione a opção Criar tabela automaticamente.

  20. Na primeira caixa Tabela, insira dbo.

  21. Na segunda caixa, insira dimension_customer.

    Captura de tela da página Destino, destacando onde as alterações foram feitas nas etapas anteriores.

  22. Faixa de opções Página Inicial, selecione Executar.

  23. Na caixa de diálogo Salvar e executar?, selecione Salvar e executar para que o pipeline carregue a tabela dimension_customer.

    Captura de tela da caixa de diálogo Salvar e executar, realçando o botão Salvar e executar.

  24. Para monitorar o progresso da atividade Copy, revise as atividades de execução de pipeline na página Saída (aguarde até que seja concluída com o status de Êxito).

    Captura de tela da página Saída, destacando o status de êxito.

Próxima etapa