Ingegneria dei dati con Databricks
Databricks offre un set completo di funzionalità di ingegneria dei dati che includono un ambiente affidabile per la collaborazione tra data scientist, ingegneri e analisti. Al centro ci sono le pipeline che ingerire e trasformano i dati. Per semplificare la progettazione delle pipeline più efficienti, Databricks offre structured streaming e DLT. Vedere Streaming in Azure Databricks e Che cos'è DLT?.
Per una panoramica del motivo per cui l'elaborazione incrementale dei dati forniti da Structured Streaming e DLT è l'opzione migliore per le pipeline di dati, vedere Come creare pipeline di dati semplici, efficienti e a bassa latenza.
Risorse aggiuntive di ingegneria dei dati
Databricks offre funzionalità per le attività di progettazione dei dati per molti scenari aggiuntivi:
- I notebook di Databricks sono uno strumento comune per la collaborazione.
- Pianifica e orchestra i flussi di lavoro usando Databricks Jobs.
- Se stai progettando soluzioni di machine learning, vedi Databricks Mosaic AI.
Nota
Se lavori principalmente con query SQL e strumenti di BI, vedere Databricks SQL.
Per esercitazioni introduttive e informazioni introduttive, vedere Introduzione ad Azure Databricks e Che cos'è Azure Databricks?.
Nome | Usa questa opzione quando vuoi... |
---|---|
DLT | Informazioni su come creare pipeline di dati per l'inserimento e la trasformazione con Databricks DLT. |
Streaming Strutturato | Informazioni sui carichi di lavoro in streaming, incrementali e in tempo reale basati su Structured Streaming in Databricks. |