Udostępnij za pośrednictwem


Informacje o wersji biblioteki DLT i proces uaktualniania wersji

W tym artykule wyjaśniono proces wydania DLT, sposób zarządzania środowiskiem uruchomieniowym DLT oraz linki do informacji o wersji dla każdej wersji DLT.

kanały środowiska uruchomieniowego DLT

Notatka

Aby wyświetlić wersje środowiska Databricks Runtime używane w edycji DLT, sprawdź informacje o wydaniu dla tej edycji.

Klastry DLT używają środowisk uruchomieniowych opartych na wersjach i zgodności opisanych w uwagach o wersji Databricks Runtime. Usługa Databricks automatycznie uaktualnia środowiska uruchomieniowe DLT, aby wspierać ulepszenia i aktualizacje platformy. Możesz użyć pola channel w ustawieniach potoku DLT, aby kontrolować wersję środowiska uruchomieniowego DLT, która uruchamia potok. Obsługiwane wartości to:

  • current, aby użyć bieżącej wersji środowiska uruchomieniowego.
  • preview przetestować przepływ z przyszłymi zmianami w wersji uruchomieniowej środowiska.

Domyślnie twoje potoki są uruchamiane przy użyciu wersji środowiska uruchomieniowego current. Databricks zaleca używanie run-time'u current dla obciążeń produkcyjnych. Aby dowiedzieć się, jak używać ustawienia preview do testowania potoków przy użyciu następnej wersji środowiska uruchomieniowego, zobacz Automate testing of your pipelines with the next runtime version (Automatyzowanie testowania potoków przy użyciu następnej wersji środowiska uruchomieniowego).

Ważny

Funkcje oznaczone jako ogólnie dostępne lub publiczna wersja zapoznawcza są dostępne w kanale current.

Aby uzyskać więcej informacji na temat kanałów DLT, sprawdź pole channel w ustawieniach potoku DLT , oznaczenie.

Aby dowiedzieć się, jak dlT zarządza procesem uaktualniania dla każdej wersji, zobacz Jak działają uaktualnienia DLT?.

Jak znaleźć wersję środowiska Databricks Runtime dla aktualizacji pipelinów?

Możesz wykonać zapytanie dotyczące dziennika zdarzeń DLT, aby znaleźć wersję środowiska Databricks Runtime dla aktualizacji potoku. Zobacz informacje o środowisku uruchomieniowym .

notatki wydania DLT

Informacje o wersji DLT są zorganizowane według roku i tygodnia roku. Ponieważ biblioteka DLT jest bez wersji, zmiany zarówno obszaru roboczego, jak i środowiska uruchomieniowego są wykonywane automatycznie. Poniższe informacje o wersji zawierają omówienie zmian i poprawek błędów w każdej wersji:

Jak działają uaktualnienia DLT?

DlT jest uważany za produkt bez wersji, co oznacza, że usługa Databricks automatycznie uaktualnia środowisko uruchomieniowe DLT w celu obsługi ulepszeń i uaktualnień do platformy. Databricks zaleca ograniczenie zależności zewnętrznych dla potoków DLT.

Databricks aktywnie działa, aby zapobiec wprowadzeniu błędów lub problemów do wdrożeniowych potoków DLT przez automatyczne uaktualnienia. Zobacz proces uaktualniania DLT.

Databricks zaleca proaktywne testowanie potoków DLT, zwłaszcza z zależnościami zewnętrznymi, przy użyciu kanałów preview. Zobacz , jak automatyzować testowanie swoich potoków przy użyciu następnej wersji środowiska uruchomieniowego.

proces aktualizacji DLT

Usługa Databricks zarządza Databricks Runtime używanymi przez zasoby obliczeniowe DLT. DLT automatycznie uaktualnia runtime w obszarach roboczych usługi Azure Databricks i monitoruje stan potoków po uaktualnieniu.

Jeśli DLT wykryje, że potok nie może uruchomić się z powodu uaktualnienia, wersja środowiska uruchomieniowego potoku zostanie przywrócona do poprzedniej wersji, która jest znana jako stabilna, a następujące kroki są automatycznie wykonywane:

  • Środowisko uruchomieniowe DLT potoku jest powiązane z poprzednią znaną dobrą wersją.
  • Obsługa usługi Databricks jest powiadamiana o problemie.
    • Jeśli problem jest związany z regresją w środowisku uruchomieniowym, usługa Databricks rozwiązuje problem.
    • Jeśli problem jest spowodowany przez bibliotekę niestandardową lub pakiet używany przez pipeline, Databricks skontaktuje się z Tobą, aby rozwiązać ten problem.
  • Po rozwiązaniu problemu usługa Databricks ponownie inicjuje uaktualnienie.

Ważny

DLT przywraca tylko potoki uruchomione w trybie produkcyjnym z kanałem ustawionym na current.

Automate testing of your pipelines with the next runtime version (Automatyzowanie testowania potoków przy użyciu następnej wersji środowiska uruchomieniowego)

Aby upewnić się, że zmiany w następnej wersji środowiska uruchomieniowego DLT nie mają wpływu na potoki, użyj funkcji kanałów DLT:

  1. Utwórz potok przejściowy i ustaw kanał na wartość preview.
  2. W interfejsie użytkownika DLT utwórz harmonogram, aby uruchomić potok co tydzień, i włącz alerty, aby otrzymywać powiadomienia e-mail o niepowodzeniach potoku. Databricks zaleca zaplanowanie cotygodniowego testowego działania potoków, zwłaszcza jeśli używasz niestandardowych zależności potoku .
  3. Jeśli otrzymasz powiadomienie o niepowodzeniu i nie możesz go rozwiązać, otwórz bilet pomocy technicznej w usłudze Databricks.

zależności potoku

Biblioteka DLT obsługuje zależności zewnętrzne w potokach; Na przykład można zainstalować dowolny pakiet języka Python przy użyciu polecenia %pip install. DLT obsługuje również używanie skryptów inicjowania o zakresie globalnym i klastrowym . Jednak te zależności zewnętrzne, szczególnie skrypty inicjowania, zwiększają ryzyko problemów z uaktualnieniami środowiska uruchomieniowego. Aby ograniczyć te zagrożenia, zminimalizuj użycie skryptów inicjowania w potokach. Jeśli przetwarzanie wymaga skryptów inicjowania, zautomatyzuj testowanie potoku, aby wcześnie wykrywać problemy; zobacz Zautomatyzuj testowanie potoków przy użyciu następnej wersji środowiska uruchomieniowego. Jeśli używasz skryptów init, usługa Databricks zaleca zwiększenie częstotliwości testowania.