Udostępnij za pośrednictwem


Samouczek: pozyskiwanie danych do magazynu

Dotyczy:✅ Magazyn w usłudze Microsoft Fabric

W tym samouczku nauczysz się, jak importować dane z Microsoft Azure Storage do magazynu danych, aby tworzyć tabele.

Notatka

Ten samouczek stanowi część kompleksowego scenariusza . Aby ukończyć ten samouczek, należy najpierw wykonać następujące samouczki:

  1. Tworzenie obszaru roboczego
  2. Tworzenie magazynu

Pozyskiwanie danych

W tym zadaniu dowiesz się, jak pozyskiwać dane do magazynu w celu utworzenia tabel.

  1. Upewnij się, że obszar roboczy utworzony w pierwszym samouczku jest otwarty.

  2. W okienku docelowym obszaru roboczego wybierz pozycję + Nowy element, aby wyświetlić pełną listę dostępnych typów elementów.

  3. Z listy w sekcji Pobierz dane wybierz typ elementu Potok danych.

  4. W oknie Nowy potok w polu Nazwa wprowadź Load Customer Data.

    Zrzut ekranu okna dialogowego Nowy potok danych z wyróżnioną wprowadzoną nazwą.

  5. Aby aprowizować potok, wybierz pozycję Utwórz. Konfigurowanie jest zakończone, gdy pojawi się strona docelowa Tworzenie potoku danych.

  6. Na stronie docelowej potoku danych wybierz Aktywność potoku.

    Zrzut ekranu przedstawiający stronę startową Budowanie potoku danych z wyróżnioną opcją Działanie potoku.

  7. W menu w sekcji Przenieś i przekształć wybierz Kopiuj dane.

    Zrzut ekranu przedstawiający sekcję Przenoszenie i przekształcanie pokazujące, gdzie wybrać pozycję Kopiuj dane.

  8. Na płótnie projektowania przepływu wybierz czynność Kopiuj dane.

    Zrzut ekranu przedstawiający kopiowanie danych znajdujących się na kanwie projektu.

  9. Aby skonfigurować działanie, na stronie Ogólne, w polu Nazwa zastąp tekst domyślny CD Load dimension_customer.

    Zrzut ekranu przedstawiający kartę Ogólne, gdzie należy wprowadzić nazwę działania kopiowania.

  10. Na stronie źródła, w rozwijanej liście Połączenie, wybierz opcję Więcej, aby zobaczyć wszystkie dostępne źródła danych, które możesz wybrać, w tym źródła danych z katalogu OneLake.

  11. Wybierz pozycję + Nowy, aby utworzyć nowe źródło danych.

  12. Wyszukaj, a następnie wybierz Azure Blobs.

  13. Na stronie Połącz źródło danych na stronie Nazwa konta lub adres URL wprowadź https://fabrictutorialdata.blob.core.windows.net/sampledata/.

  14. Zwróć uwagę, że lista rozwijana nazwa połączenia jest wypełniana automatycznie i że rodzaj uwierzytelniania ma ustawioną wartość Anonimowe.

    Zrzut ekranu przedstawiający okno Łączenie ze źródłem danych z wyświetlonymi wszystkimi ustawieniami.

  15. Wybierz pozycję Połącz.

  16. Aby uzyskać dostęp do plików Parquet w źródle danych, na stronie Source wykonaj następujące ustawienia:

    1. W polach Ścieżka pliku wprowadź:

      1. ścieżka pliku — kontener:sampledata

      2. Ścieżka pliku — katalog:WideWorldImportersDW/tables

      3. Ścieżka pliku — nazwa pliku:dimension_customer.parquet

    2. Na liście rozwijanej Format pliku wybierz pozycję Parquet.

  17. Aby wyświetlić podgląd danych i sprawdzić, czy nie ma żadnych błędów, wybierz pozycję Podgląd danych.

    Zrzut ekranu przedstawiający stronę źródłową z wyróżnionymi zmianami, które zostały wprowadzone w poprzednich krokach, oraz funkcją podglądu danych.

  18. Na stronie Miejsce docelowe z listy rozwijanej Połączenie wybierz magazyn Wide World Importers.

  19. W przypadku opcji Tabelawybierz opcję Automatyczne tworzenie tabeli.

  20. W pierwszym polu Tabela wprowadź dbo.

  21. W drugim polu wprowadź dimension_customer.

    Zrzut ekranu przedstawiający stronę Docelową z wyróżnioną lokalizacją zmian w poprzednich krokach.

  22. Na wstążce Narzędzia główne wybierz pozycję Uruchom.

  23. W oknie dialogowym Zapisz i uruchom?, wybierz pozycję Zapisz i uruchom, aby potok załadował tabelę dimension_customer.

    Zrzut ekranu okna dialogowego Zapisywanie i uruchamianie z wyróżnionym przyciskiem Zapisz i uruchom.

  24. Aby monitorować postęp aktywności kopiowania, sprawdź działania uruchomienia potoku na stronie Output (poczekaj, aż status zmieni się na Powodzenie).

    Zrzut ekranu przedstawiający stronę wyjścia ze stanem oznaczonym jako Powodzenie.

Następny krok