Samouczek: pozyskiwanie danych do magazynu
Dotyczy:✅ Magazyn w usłudze Microsoft Fabric
W tym samouczku nauczysz się, jak importować dane z Microsoft Azure Storage do magazynu danych, aby tworzyć tabele.
Notatka
Ten samouczek stanowi część kompleksowego scenariusza . Aby ukończyć ten samouczek, należy najpierw wykonać następujące samouczki:
Pozyskiwanie danych
W tym zadaniu dowiesz się, jak pozyskiwać dane do magazynu w celu utworzenia tabel.
Upewnij się, że obszar roboczy utworzony w pierwszym samouczku jest otwarty.
W okienku docelowym obszaru roboczego wybierz pozycję + Nowy element, aby wyświetlić pełną listę dostępnych typów elementów.
Z listy w sekcji Pobierz dane wybierz typ elementu Potok danych.
W oknie Nowy potok w polu Nazwa wprowadź
Load Customer Data
.Aby aprowizować potok, wybierz pozycję Utwórz. Konfigurowanie jest zakończone, gdy pojawi się strona docelowa Tworzenie potoku danych.
Na stronie docelowej potoku danych wybierz Aktywność potoku.
W menu w sekcji Przenieś i przekształć wybierz Kopiuj dane.
Na płótnie projektowania przepływu wybierz czynność Kopiuj dane.
Aby skonfigurować działanie, na stronie Ogólne, w polu Nazwa zastąp tekst domyślny
CD Load dimension_customer
.Na stronie źródła, w rozwijanej liście Połączenie, wybierz opcję Więcej, aby zobaczyć wszystkie dostępne źródła danych, które możesz wybrać, w tym źródła danych z katalogu OneLake.
Wybierz pozycję + Nowy, aby utworzyć nowe źródło danych.
Wyszukaj, a następnie wybierz Azure Blobs.
Na stronie Połącz źródło danych na stronie Nazwa konta lub adres URL wprowadź
https://fabrictutorialdata.blob.core.windows.net/sampledata/
.Zwróć uwagę, że lista rozwijana nazwa połączenia
jest wypełniana automatycznie i że rodzaj uwierzytelniania ma ustawioną wartość Anonimowe .Wybierz pozycję Połącz.
Aby uzyskać dostęp do plików Parquet w źródle danych, na stronie Source wykonaj następujące ustawienia:
W polach Ścieżka pliku wprowadź:
ścieżka pliku — kontener:
sampledata
Ścieżka pliku — katalog:
WideWorldImportersDW/tables
Ścieżka pliku — nazwa pliku:
dimension_customer.parquet
Na liście rozwijanej Format pliku wybierz pozycję Parquet.
Aby wyświetlić podgląd danych i sprawdzić, czy nie ma żadnych błędów, wybierz pozycję Podgląd danych.
Na stronie Miejsce docelowe z listy rozwijanej Połączenie wybierz magazyn
Wide World Importers
.W przypadku opcji Tabelawybierz opcję Automatyczne tworzenie tabeli.
W pierwszym polu Tabela wprowadź
dbo
.W drugim polu wprowadź
dimension_customer
.Na wstążce Narzędzia główne wybierz pozycję Uruchom.
W oknie dialogowym Zapisz i uruchom?, wybierz pozycję Zapisz i uruchom, aby potok załadował tabelę
dimension_customer
.Aby monitorować postęp aktywności kopiowania, sprawdź działania uruchomienia potoku na stronie Output (poczekaj, aż status zmieni się na Powodzenie).