Usare Apache Spark MLlib in Azure Databricks
Questa pagina fornisce notebook di esempio che illustrano come usare MLlib in Azure Databricks.
Apache Spark MLlib è la libreria di Machine Learning di Apache Spark costituita da utilità e algoritmi di apprendimento comuni, tra cui classificazione, regressione, clustering, filtro collaborativo, riduzione della dimensionalità e primitive di ottimizzazione sottostanti. Per informazioni di riferimento sulle funzionalità di MLlib, Azure Databricks consiglia di consultare la documentazione di riferimento seguente sulle API per Apache Spark:
- Guida alla programmazione di MLlib
- Informazioni di riferimento per l'API Python
- Informazioni di riferimento per l'API Scala
- API Java
Per informazioni sull'uso di Apache Spark MLlib da R, consultare la documentazione di Apprendimento automatico per R.
Questo notebook illustra come creare un'applicazione di classificazione binaria usando l'API Pipelines di Apache Spark MLlib.
Questi esempi illustrano varie applicazioni degli alberi delle decisioni usando l'API Pipelines di Apache Spark MLlib.
Questi notebook illustrano come eseguire le classificazioni con gli alberi delle decisioni.
Questo notebook illustra come usare le pipeline MLlib per eseguire una regressione usando alberi con boosting a gradienti per prevedere il numero di noleggi di biciclette (all'ora) da informazioni quali il giorno della settimana, il meteo, la stagione e così via.
Questo notebook illustra come creare un trasformatore personalizzato.