Rekayasa data dengan Databricks
Databricks menyediakan serangkaian fitur rekayasa data yang kaya yang mencakup lingkungan yang kuat untuk kolaborasi antara ilmuwan data, insinyur, dan analis. Melalui bagian tengahnya adalah pipa yang menyerap dan mengubah data. Untuk mempermudah rekayasa alur yang paling efisien, Databricks menawarkan Streaming Terstruktur dan DLT. Lihat streaming di Azure Databricks dan Apa itu DLT?.
Untuk gambaran umum tentang mengapa pemrosesan aliran bertahap dari data yang berasal dari Streaming Terstruktur dan DLT adalah opsi terbaik untuk alur data, lihat Cara membangun alur data yang sederhana, efisien, dan memiliki latensi rendah.
Sumber daya rekayasa data tambahan
Databricks menyediakan fitur untuk tugas rekayasa data untuk banyak skenario tambahan:
- Databricks notebook adalah alat yang populer untuk kolaborasi.
- Jadwalkan dan alokasikan alur kerja Anda menggunakan Databricks Jobs.
- Lihat Databricks Mosaic AI jika Anda merancang solusi pembelajaran mesin.
Nota
Jika Anda terutama bekerja dengan kueri SQL dan alat BI, lihat Databricks SQL.
Untuk memulai tutorial dan informaton pengantar, lihat Mulai menggunakan Azure Databricks dan Apa itu Azure Databricks?.
Nama | Gunakan ini ketika Anda ingin... |
---|---|
DLT | Pelajari cara membangun alur data untuk penyerapan dan transformasi dengan Databricks DLT. |
Streaming Terstruktur | Pelajari tentang beban kerja streaming, inkremental, dan real-time yang didukung oleh Streaming Terstruktur di Databricks. |