LightGBM算法总结

LightGBM算法总结

向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程  公众号: datayx

目录

1 LightGBM原理

1 LightGBM原理

1.2 LightGBM 的动机

LightGBM算法总结

  使用直方图算法有很多优点。首先,最明显就是内存消耗的降低,直方图算法不仅不需要额外存储预排序的结果,而且可以只保存特征离散化后的值,而这个值一般用 8 位整型存储就足够了,内存消耗可以降低为原来的1/8。  

LightGBM算法总结

然后在计算上的代价也大幅降低,预排序算法每遍历一个特征值就需要计算一次分裂的增益,而直方图算法只需要计算k次(k可以认为是常数),时间复杂度从O(#data*#feature)优化到O(k*#features)。  


访问AI图谱 技术分享社区 

https://loveai.tech


LightGBM算法总结

Leaf-wise 则是一种更为高效的策略,每次从当前所有叶子中,找到分裂增益最大的一个叶子,然后分裂,如此循环。因此同 Level-wise 相比,在分裂次数相同的情况下,Leaf-wise 可以降低更多的误差,得到更好的精度。Leaf-wise 的缺点是可能会长出比较深的决策树,产生过拟合。因此 LightGBM 在 Leaf-wise 之上增加了一个最大深度的限制,在保证高效率的同时防止过拟合。

LightGBM算法总结

1.4.3 直方图加速

LightGBM算法总结

1.4.4 直接支持类别特征

LightGBM算法总结

1.4.5 LightGBM并行优化

LightGBM算法总结

LightGBM算法总结

LightGBM算法总结

1.5 其他注意XGboost ,lightGBM案例代码

关注微信公众号 datayx  然后回复 GBM 即可获取。

 5 lightGBM的坑

    使用min_data_per_group,cat_smooth去处理过拟合(当#data比较小,或者#category比较大)

https://blog.****.net/weixin_39807102/article/details/81912566


阅读过本文的人还看了以下:

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

LightGBM算法总结

长按图片,识别二维码,点关注

访问AI图谱  

https://loveai.tech

LightGBM算法总结

LightGBM算法总结