学习《机器学习100天》第25天 随机森林
github上的项目,跟着一起学习
项目地址 https://github.com/MLEveryday/100-Days-Of-ML-Code
随机森林:有监督 集成学习模型(建立很多决策树,再集成) 主要用于分类和回归
随机森林与决策树的区别:随机森林中,查找根节点和分割特征节点的过程是随机进行的。
决策树的构建方式:
1. 随机选取数据:训练集N个样本,有放回的随机抽取n个
2.特征的随机选取:样本有M个特征,随机选取其中的m个,将m个中最优的分裂特征用来分裂节点
随机森林的预测:
1. 用每个决策树的规则来预测测试特征的结果
2. 计算每个预测目标的票数
3. 票数最高的作为最终结果