Zadanie w ramach procesów DLT dla zleceń
Zadania zapewniają proceduralne podejście do definiowania relacji między zadaniami. Potoki DLT zapewniają deklaratywne podejście do definiowania relacji między zestawami danych a przekształceniami . Na tej stronie opisano sposób planowania wyzwalanych potoków DLT do uruchamiania jako zadania w zadaniu usługi Databricks przy użyciu interfejsu użytkownika zadań, interfejsu użytkownika potoku DLT lub języka SQL.
Notatka
wyzwalany potok DLT to potok, który nie działa w sposób ciągły i musi być uruchamiany, aby działać. Zadanie w ramach potoku może być mechanizmem inicjującym dla aktywowanego potoku DLT. Ciągłe rurociągi nie muszą być wyzwalane, więc ich wyzwalanie za pomocą zadania byłoby zbędne. Aby dowiedzieć się więcej na temat wyzwalanych i ciągłych potoków, zobacz Wyzwalany i ciągły tryb potoku.
konfigurowanie zadania potoku DLT za pomocą interfejsu użytkownika zadań
Potoki DLT zarządzają wszystkimi konfiguracjami kodu źródłowego i obliczeń w definicji potoku.
Aby dodać rurociąg do zadania, wykonaj następujące kroki:
- Utwórz nowe zadanie i nadaj nowe zadanie i wybierz potoku DLT dla typu.
- W menu rozwijanym potoku wybierz istniejący potok DLT.
- Można opcjonalnie wyzwolić pełne odświeżanie potoku DLT.
Ważne
Za pomocą zadania Pipeline można używać tylko wyzwalanych potoków. Potoki ciągłe nie są obsługiwane jako zadanie zadania podrzędnego.
Zaprogramuj potok DLT przy użyciu interfejsu użytkownika potoku
Dodanie harmonogramu do pipeline powoduje utworzenie zadania zawierającego pojedyncze zadanie w pipeline. Wyzwalacze harmonogramu opartego na czasie można skonfigurować tylko przy użyciu tego interfejsu użytkownika. Aby uzyskać bardziej zaawansowane opcje wyzwalania, zobacz Konfigurowanie zadania potoku DLT przy użyciu interfejsu użytkownika zadań.
Skonfiguruj zadanie potokowe w zaplanowanym zadaniu w interfejsie użytkownika potoku, wykonując następujące czynności:
- Kliknij DLT na pasku bocznym.
- Kliknij nazwę potoku. Zostanie wyświetlony interfejs użytkownika potoku.
- Kliknij pozycję Harmonogram.
- Jeśli dla pipeline'u nie istnieje żaden harmonogram, zostanie wyświetlone okno dialogowe Nowy harmonogram.
- Jeśli co najmniej jeden harmonogram już istnieje, kliknij przycisk Dodaj harmonogram.
- Wprowadź unikatową nazwę zadania w polu nazwa zadania.
- (Opcjonalnie) Zaktualizuj częstotliwość harmonogramu.
- Wybierz Zaawansowane, aby uzyskać bardziej szczegółowe opcje, w tym składnię cron.
- (Opcjonalnie) W obszarze więcej opcji skonfiguruj co najmniej jeden adres e-mail, aby otrzymywać alerty dotyczące rozpoczęcia, powodzenia lub niepowodzenia pipeline.
- Kliknij pozycję Utwórz.
Notatka
Jeśli pipeline jest uwzględniony w co najmniej jednym zaplanowanym zadaniu, przycisk Harmonogram pokazuje liczbę istniejących harmonogramów, na przykład Harmonogram (5).
Utworzenie harmonogramu dla zmaterializowanego widoku lub tabeli przesyłania strumieniowego w Databricks SQL
Zmaterializowane widoki i tabele strumieniowe, zdefiniowane w Databricks SQL, obsługują planowanie oparte na czasie, określone w poleceniach CREATE
lub ALTER
.
Aby uzyskać szczegółowe informacje, zobacz następujące artykuły: