LightGBM原理简介
提升方法
树的生长策略
LightGBM的改进
直方图优化
通过直方图算法对内存的使用进行优化。
直方图作差加速
选取样本量少的叶子结点进行统计,就可以通过作差得到另一个叶子结点直方图。
带深度限制的叶子生长策略
提升缓存命中率
类别特征支持
并行学习支持
特征并行
数据并行
投票并行
投票并行,合并部分特征的直方图,降低通信量。
Voting parallel,参考论文“A Communication-Efficient Parallel Algorithm for Decision Tree”
其他特性
https://www.zhihu.com/question/64943934
参考资料
原论文http://papers.nips.cc/paper/6907-lightgbm-a-highly-efficient-gradient-boosting-decision-tree
如何玩转LightGBM Taifeng Wang
GBDT算法原理与系统设计简介 weapon