Jak używać notatników usługi Microsoft Fabric
Notatniki Microsoft Fabric to podstawowy element kodu do tworzenia zadań Apache Spark i eksperymentów uczenia maszynowego. Jest to interaktywna powierzchnia internetowa używana przez analityków danych i inżynierów danych do pisania kodu korzystającego z zaawansowanych wizualizacji i tekstu markdown. Inżynierowie danych piszą kod na potrzeby pozyskiwania danych, przygotowywania danych i przekształcania danych. Analitycy danych używają również notesów do tworzenia rozwiązań uczenia maszynowego, w tym tworzenia eksperymentów i modeli, śledzenia modeli i wdrażania.
Z notatnikiem Fabric możesz:
- Rozpocznij pracę z zerowym nakładem pracy nad konfiguracją.
- Łatwe eksplorowanie i przetwarzanie danych przy użyciu intuicyjnego środowiska z małą ilością kodu.
- Zabezpieczanie danych za pomocą wbudowanych funkcji zabezpieczeń przedsiębiorstwa.
- Analizowanie danych w formatach pierwotnych (CSV, txt, JSON itp.), przetworzonych formatów plików (parquet, Delta Lake itp.), przy użyciu zaawansowanych funkcji platformy Spark.
- Pracuj wydajniej dzięki ulepszonym możliwościom tworzenia i wbudowanym wizualizacjom danych.
W tym artykule opisano sposób używania notesów w środowiskach nauki o danych i inżynierii danych.
Kontekst zabezpieczeń uruchamianego notesu
Wykonywanie notesu może być wyzwalane przez trzy różne sposoby w usłudze Fabric z pełną elastycznością w celu spełnienia różnych scenariuszy:
- Uruchamianie interakcyjne: użytkownik ręcznie wyzwala wykonywanie za pośrednictwem różnych elementów interfejsu użytkownika lub wywołuje REST API. Realizacja będzie uruchomiona w kontekście zabezpieczeń obecnego użytkownika.
- Uruchom jako aktywność w ramach potoku: wykonanie jest inicjowane z potoku w usłudze Fabric Data Factory. Szczegółowe kroki można znaleźć w działaniu notesu. Realizacja będzie się odbywała w kontekście zabezpieczeń właściciela potoku.
- Harmonogram: wykonanie jest wyzwalane przez plan harmonogramu. Wykonanie będzie uruchamiane w kontekście zabezpieczeń użytkownika, który konfiguruje/aktualizuje plan harmonogramu.
Elastyczność tych opcji wykonywania z różnymi kontekstami zabezpieczeń umożliwia spełnienie różnych scenariuszy i wymagań, ale także wymaga, aby podczas projektowania i opracowywania notesu pamiętać o kontekście zabezpieczeń, w przeciwnym razie może to spowodować nieoczekiwane zachowanie, a nawet niektóre problemy z zabezpieczeniami.
Przy pierwszym utworzeniu notesu zostanie wyświetlony komunikat ostrzegawczy przypominający o ryzyku uruchomienia kodu bez jego przeglądania.
Poniżej przedstawiono kilka najlepszych rozwiązań, które ułatwiają uniknięcie problemów z zabezpieczeniami:
- Przed ręcznym uruchomieniem notesu, otwórz ustawienia notesu i sprawdź sekcję Szczegóły w panelu Informacje dla aktualizacji modyfikacji, upewnij się, że akceptujesz najnowsze zmiany.
- Przed dodaniem aktywności notatnika do potoku, otwórz ustawienia notatnika i sprawdź sekcję Szczegóły w panelu Informacje, aby zobaczyć wprowadzone zmiany, upewnij się, że akceptujesz najnowsze zmiany. Jeśli nie masz pewności co do najnowszej zmiany, najpierw otwórz Notatnik, aby przejrzeć zmianę przed dodaniem jej do potoku.
- Przed zaktualizowaniem planu harmonogramu otwórz ustawienia Notatnika i sprawdź sekcję Szczegóły w panelu Informacje, aby uzyskać informacje o aktualizacji modyfikacji, upewnij się, że akceptujesz najnowszą zmianę. Jeśli nie masz pewności co do najnowszej zmiany, otwórz notes, aby przejrzeć zmianę przed zaktualizowaniem planu harmonogramu.
- Rozdziel obszar roboczy na różne etapy (tworzenie, testowanie, produkcyjny) i kontroluj dostęp w różnych etapach, aby uniknąć problemów z bezpieczeństwem. Dodaj tylko użytkownika, któremu ufasz, do etapu prod.
Twórz notesy
Możesz utworzyć nowy notes lub zaimportować istniejący notes.
Tworzenie nowego notesu
Podobnie jak przy innych standardowych procesach tworzenia elementów Fabric, nowy notes można łatwo utworzyć ze strony głównej Fabric Data Engineering, opcji Nowa w obszarze roboczym lub Utwórz centrum.
Importowanie istniejących notatników
Możesz zaimportować jeden lub więcej istniejących notesów z komputera lokalnego, korzystając z opcji na pasku narzędzi obszaru roboczego. Notesy tkaninowe rozpoznają standardowe pliki notesów Jupyter Notebook .ipynb oraz pliki źródłowe, takie jak .py, .scalai .sql, i odpowiednio tworzą nowe notatniki.
Eksportowanie notesu
Notatnik można wyeksportować do innych standardowych formatów. Notatnik Synapse można wyeksportować do:
- Standardowy plik (.ipynb) używany do notebooków Jupyter.
- Plik HTML (.html), który można otworzyć bezpośrednio z przeglądarki.
- Plik języka Python (.py).
- Plik lateksowy (.tex).
Zapisywanie notesu
W Fabric notes będą domyślnie zapisywane automatycznie po otwarciu i edycji; nie musisz martwić się o utratę zmian kodu. Możesz również użyć polecenia Zapisz kopię , aby sklonować inną kopię w bieżącym obszarze roboczym lub w innym obszarze roboczym.
Jeśli wolisz ręcznie zapisać notes, możesz przełączyć się na opcję Zapisywanie ręczne , aby mieć lokalną gałąź elementu notesu, a następnie użyć opcji Zapisz lub CTRL+s , aby zapisać zmiany.
Możesz również przełączyć się do trybu zapisywania ręcznego, wybierając pozycję Edytuj ->Zapisz opcje ->Manual. Aby włączyć lokalną gałąź notesu, a następnie zapisać go ręcznie, wybierz pozycję Zapisz lub użyj skrótu klawiaturowego Ctrl+s .
Połącz lakehouse'y i notatniki
Notatniki Fabric obsługują teraz bliskie interakcje z lakehouse'ami; możesz łatwo dodać nowy lub istniejący lakehouse z Eksploratora Lakehouse.
Możesz przejść do różnych jezior w eksploratorze Lakehouse i ustawić jeden lakehouse jako domyślny, przypinając go. Twoja domyślna konfiguracja jest następnie zamontowana w katalogu roboczym środowiska wykonawczego, a ty możesz odczytywać lub zapisywać w domyślnym lakehouse przy użyciu ścieżki lokalnej.
Uwaga
Musisz ponownie uruchomić sesję po przypięeniu nowego lakehouse lub zmianie nazwy domyślnego lakehouse.
Dodawanie lub usuwanie domu nad jeziorem
Wybranie ikony X obok nazwy lakehouse powoduje usunięcie jej z zakładki notesu, ale element lakehouse nadal istnieje w obszarze roboczym.
Wybierz Dodaj lakehouse, aby dodać więcej lakehouse do notesu, dodając istniejący lub tworząc nowy lakehouse.
Eksplorowanie pliku lakehouse
Podkatalog i pliki w sekcji Tabele i Pliki widoku Jezioro są wyświetlane w obszarze treści między listą lakehouse a zawartością notesu. Wybierz różne foldery w sekcji Tabele i pliki , aby odświeżyć obszar zawartości.
Operacje na folderach i plikach
Jeśli wybierzesz plik (.csv,.parquet,.txt,.jpg,.pngitp.) prawym kliknięciem myszy, możesz załadować dane przy użyciu interfejsu API Spark lub Pandas. Nowa komórka kodu jest generowana i wstawiana pod komórką fokusu.
Możesz łatwo skopiować ścieżkę z innym formatem niż wybrany plik lub folder i użyć odpowiedniej ścieżki w kodzie.
Zasoby notesu
Eksplorator zasobów notesu udostępnia system plików podobny do systemu Unix, który ułatwia zarządzanie folderami i plikami. Oferuje on zapisywalną przestrzeń systemu plików, w której można przechowywać małe pliki, takie jak moduły kodu, modele semantyczne i obrazy. Dostęp do nich można łatwo uzyskać za pomocą kodu w notesie tak, jakby pracować z lokalnym systemem plików.
Uwaga
- Maksymalna liczba magazynów zasobów dla folderu wbudowanego i folderu środowiskowego wynosi 500 MB, a rozmiar pojedynczego pliku wynosi do 100 MB. Obie umożliwiają łącznie maksymalnie 100 wystąpień plików/folderów.
- Podczas używania
notebookutils.notebook.run()
, użyj polecenianotebookutils.nbResPath
, aby uzyskać dostęp do docelowego zasobu notesu. Ścieżka względna builtin/ zawsze wskazuje na wbudowany folder katalogu głównego notesu.
Folder zasobów wbudowanych
Folder zasobów wbudowanych jest folderem zdefiniowanym przez system unikatowym dla każdego notesu. Zaleca się używanie wbudowanego folderu zasobów do przechowywania wszystkich danych używanych w bieżącym notesie. Poniżej przedstawiono kluczowe możliwości zasobów laptopa.
- Możesz użyć typowych operacji, takich jak tworzenie/usuwanie, przekazywanie/pobieranie, przeciąganie/upuszczanie, zmienianie nazwy, duplikowanie i wyszukiwanie za pośrednictwem interfejsu użytkownika.
- Możesz użyć ścieżek względnych, takich jak
builtin/YourData.txt
na potrzeby szybkiej eksploracji. Metodanotebookutils.nbResPath
ułatwia tworzenie pełnej ścieżki. - Zweryfikowane dane można łatwo przenieść do lakehouse za pomocą opcji Zapisz do lakehouse. Fabric osadza bogate fragmenty kodu dla typowych rodzajów plików, aby ułatwić szybkie rozpoczęcie pracy.
- Te zasoby są również dostępne do użycia w przypadku uruchamiania notesu referencyjnego za pośrednictwem
notebookutils.notebook.run()
.
Folder zasobów środowiska
Folder zasobów środowiska to udostępnione repozytorium, które usprawnia współpracę w wielu notesach.
Kartę Zasoby można znaleźć w środowisku i mieć pełne operacje do zarządzania plikami zasobów tutaj. Te pliki można współdzielić w wielu notesach po podłączeniu notesu do bieżącego środowiska.
Na stronie Notes można łatwo znaleźć drugi folder główny w obszarze Zasoby dziedziczone ze środowiska dołączonego.
Można również pracować na plikach/folderach tak samo, jak w folderze Wbudowane zasoby.
Ścieżka zasobu Środowisko jest automatycznie instalowana w klastrze notesów. Aby uzyskać dostęp do zasobów środowiska, możesz użyć ścieżki względnej /env.
Edytor plików
Edytor plików umożliwia wyświetlanie i edytowanie plików bezpośrednio w folderze zasobów notesu i folderze zasobów środowiska w notesie. Obsługiwane typy plików to CSV, TXT, HTML, YML, PY, SQL i inne. Za pomocą edytora plików można łatwo uzyskiwać dostęp do i modyfikować pliki w notesie, obsługuje wyróżnianie słów kluczowych i zapewnia niezbędną usługę językową podczas otwierania i edytowania plików kodu, takich jak .py i .sql.
Dostęp do tej funkcji można uzyskać za pomocą opcji "Wyświetl i edytuj" w menu plików. Dwukrotne kliknięcie pliku jest szybszym sposobem.
Zmiana zawartości w edytorze plików musi zostać zapisana ręcznie, klikając przycisk Zapisz lub skrót klawiaturowy: Ctrl+S, edytor plików nie obsługuje automatycznego zapisywania.
tryb notebooka również wpływa na edytor plików. Możesz wyświetlać tylko pliki, ale nie można ich edytować, jeśli jesteś w trybie notesu bez uprawnień do edycji.
Uwaga
Poniżej przedstawiono pewne ograniczenia dotyczące edytora plików.
- Limit rozmiaru pliku wynosi 1 MB.
- Te typy plików nie są obsługiwane do wyświetlania i edytowania: .xlsx i parquet.
Współpracuj w notesie
Notatnik Fabric to narzędzie współpracy, które pozwala wielu użytkownikom edytować ten sam notatnik.
Po otwarciu notesu domyślnie wprowadzasz tryb współedytowania, a każda edycja notesu jest zapisywana automatycznie. Jeśli współpracownicy otwierają ten sam notes w tym samym czasie, zobaczysz ich profil, wyniki uruchomienia, wskaźnik kursora, wskaźnik wyboru i ślad edytowania. Korzystając z funkcji współpracy, można łatwo wykonać programowanie w parach, zdalne debugowanie i nauczanie.
Udostępnianie notesu
Udostępnianie notesu jest wygodnym sposobem współpracy z członkami zespołu. Autoryzowane role obszaru roboczego mogą domyślnie wyświetlać lub edytować/uruchamiać notesy. Możesz udostępnić notatnik z określonymi uprawnieniami.
Wybierz pozycję Udostępnij na pasku narzędzi notesu.
Wybierz odpowiednią kategorię osób, które mogą wyświetlić ten notatnik. Możesz wybrać opcję Udostępnij, Edytuj lub Uruchom uprawnienia dla adresatów.
Po wybraniu Zastosuj możesz wysłać notatnik bezpośrednio lub skopiować link do innych osób. Adresaci mogą następnie otworzyć notes z odpowiednim widokiem przyznanym przez ich poziom uprawnień.
Aby dalej zarządzać uprawnieniami notesu, wybierz pozycję Lista elementów obszaru roboczego>Więcej opcji, a następnie wybierz pozycję Zarządzaj uprawnieniami. Na tym ekranie możesz zaktualizować istniejący dostęp do notesu i uprawnienia.
Dodawanie komentarza do komórki kodu
Komentowanie to kolejna przydatna funkcja dla scenariuszy współpracy. Obecnie Fabric obsługuje dodawanie komentarzy na poziomie komórki.
Wybierz przycisk Komentarze na pasku narzędzi notesu lub wskaźnik komentarzy komórki, aby otworzyć okienko Komentarze.
Wybierz kod w komórce kodu, wybierz pozycję Nowy w okienku Komentarze , dodaj komentarze, a następnie wybierz pozycję Opublikuj komentarz , aby zapisać.
Jeśli są one potrzebne, znajdź opcje Edytuj komentarz, Rozwiąż wątek i Usuń wątek, wybierając opcję Więcej obok komentarza.
Tagowanie innych osób w komentarzu
"Tagowanie" odnosi się do wspomnienia i powiadomienia użytkownika w wątku komentarzy, zapewniając efektywną współpracę w odniesieniu do szczegółów.
Wybierz sekcję kodu w komórce i zainicjuj nowy wątek komentarza.
Wprowadź nazwę użytkownika i wybierz poprawną nazwę na liście sugestii, jeśli chcesz wspomnieć kogoś w dyskusji na temat określonej sekcji.
Udostępnij swoje szczegółowe informacje i opublikuj je.
Zostanie wyzwolone powiadomienie e-mail, a użytkownik kliknie link Otwórz komentarze, aby szybko zlokalizować tę komórkę.
Ponadto autoryzuj i konfiguruj uprawnienia dla użytkowników podczas tagowania osoby, która nie ma dostępu, zapewniając, że zasoby kodu są dobrze zarządzane.
Uwaga
W przypadku elementu komentarza otagowany użytkownik nie otrzyma już powiadomienia e-mail, jeśli zaktualizujesz komentarz w ciągu jednej godziny. Wysyła jednak powiadomienie e-mail do nowego oznakowanego użytkownika.
Historia wersji
Uwaga
Obecnie funkcja jest dostępna w wersji zapoznawczej.
Historia wersji umożliwia łatwe zarządzanie wersjami zmian w notesie na żywo. Obsługuje ona śledzenie historii i zarządzanie notesami z niezawodnymi wbudowanymi funkcjami kontroli wersji, co jest szczególnie przydatne w przypadku współpracy z wieloma współautorami w tym samym notesie.
Umożliwiaj dostęp do historii wersji z globalnego paska narzędzi notesu.
Notatnik obsługuje dwa sposoby tworzenia punktów kontrolnych.
Ręczny punkt kontrolny: możesz ręcznie utworzyć nową wersję, aby zarejestrować kamienie milowe rozwoju, co zapewnia elastyczność w zarządzaniu wersjami notesu.
Punkt kontrolny systemu: te punkty kontrolne są tworzone automatycznie co 5 minut na podstawie interwału czasu edycji przez system notesów, zapewniając, że praca jest spójnie zapisywana i wersjonowana. Rekordy modyfikacji można znaleźć na liście osi czasu punktów kontrolnych systemu.
Możesz kliknąć punkt kontrolny, aby otworzyć widok różnic , wyróżnia różnice między zawartością wybranego punktu kontrolnego a bieżącą wersją na żywo, w tym różnice zawartości komórki, dane wyjściowe komórki i metadane. Wersja tego punktu może być zarządzana indywidualnie w menu "więcej opcji" .
Możesz zarządzać wersją z menu rozwijanego punktu kontrolnego, jeśli chcesz zachować poprzednią wersję, kliknij przywróć z punktu kontrolnego i zastąp bieżący notatnik lub użyj zapisz jako kopię, aby sklonować go do nowego notatnika.
Uwaga
- Znane ograniczenie: Po kliknięciu przycisku Przywróć i przejściu Wróć do notesu, notes nie zostanie natychmiast odzyskany z punktu kontrolnego. Na pasku komunikatów zostanie wyświetlony monit o wyświetlenie zmian. Musisz kliknąć przycisk Wyświetl zmiany, a następnie wybrać opcję zachowania Zapisana wersja, aby zakończyć proces przywracania.
- Punkty kontrolne systemu wygasną po upływie 1 roku.
Przełącznik trybu notatnika
Notesy sieci szkieletowej obsługują cztery tryby, które można łatwo przełączać: Tworzenie trybu,Uruchamianie tylko w trybie, tryb Edytowanie i tryb View. Każdy tryb odpowiada określonej kombinacji uprawnień. Podczas udostępniania notesu innym członkom zespołu można przyznać adresatom odpowiednie uprawnienia. Widzą najlepszy dostępny tryb notesu zgodnie z ich uprawnieniami i mogą przełączać się między trybem, do którego mają uprawnienia.
- Tryb deweloperski: wymagane jest uprawnienie do odczytu, zapisu, wykonywania.
- Tryb uruchamiania: wymagane uprawnienia do odczytu i wykonywania.
- Tryb edycji: wymagane uprawnienia do odczytu, zapisu.
- Tryb wyświetlania: wymagane uprawnienia do odczytu.