Prehľad LightGBM v SynapseML
LightGBM je open-source verzia, distribuovaná a vysoko výkonná architektúra na zvýšenie prechodu (GBDT, GBRT, GBM alebo MART). Táto architektúra sa špecializuje na vytváranie vysokokvalitných algoritmov rozhodovacieho stromu a algoritmov rozhodovacieho stromu podporujúcich gpu na vytváranie zoraďovania, klasifikácie a mnohých ďalších úloh strojového učenia. LightGBM je súčasťou projektu DMTK od spoločnosti Microsoft.
Výhody LightGBM
- Zložiteľnosť: Modely LightGBM je možné začleniť do existujúcich kanálov SparkML a používať na dávkové, streamované a slúžiace vyťaženia.
- Výkon: LightGBM on Spark je o 10 až 30 % rýchlejší ako protokol SparkML v množine údajov Higgs a dosahuje 15 % zvýšenie AUC. Paralelné experimenty overili, že LightGBM môže dosiahnuť lineárnu rýchlosť pomocou viacerých počítačov na trénovaie v konkrétnych nastaveniach.
- Funkcie: LightGBM ponúka širokú škálu tuniakových parametrov, ktoré možno použiť na prispôsobenie svojho rozhodovacieho stromového systému. LightGBM on Spark tiež podporuje nové typy problémov, ako je napríklad regresia kvantifikácie.
- Krížová platforma: LightGBM on Spark je k dispozícii v spark, PySpark a SparklyR.
Použitie LightGBM
- LightGBMClassifier: používa sa na vytváranie modelov klasifikácie. Napríklad na predpovedanie, či spoločnosť zbankrotuje alebo nie, by sme mohli vytvoriť model binárnej klasifikácie s adresou
LightGBMClassifier
. - LightGBMRegressor: používa sa na vytváranie regresných modelov. Napríklad pri predpovedaní ceny bývania môžeme vytvoriť regresný model s .
LightGBMRegressor
- LightGBMRanker: používa sa na vytváranie modelov hodnotenia. Napríklad na predpovedanie relevancie výsledkov vyhľadávania webových lokalít môžeme vytvoriť model zoradenia s hodnotou
LightGBMRanker
.