b站学习视频——机器学习经典算法(2)——决策树与随机森林
决策树讲解(附源码)
南开大学决策树(还没有看)
一 决策树概述



二 熵原理形象解读(ID-3算法)
熵值代表集合内部的混乱程度



以色泽为属性计算信息增益


三 如何利用熵原理构造决策树(以天气和游玩的关系为例)




四 信息增益率(改进的C4.5算法)
如何解决信息样本的属性很多,但每个属性集合中的样本很少






五 决策树剪枝(解决过拟合问题)
在后剪枝过程中,可以通过调整α的值,来决定叶子结点的数量对于当前损失函数的影响成度



六 随机森林
其实就是多个决策树的组合,共同完成分类或者回归操作
随机性——数据随机性、属性随机性

七 决策树参数案例
加载数据、为数据添加列标志

describe ——描述各类信息

