集成学习之Bagging

① Bagging又叫自助聚集，是一种根据均匀概率分布从数据中重复抽样（有放回）的技术。
② 每个抽样生成的自助样本集上，训练一个基分类器；对训练过的分类器进行投票，将测试样本指派到得票最高的类中。
③ 每个自助样本集都和原数据一样大
④ 有放回抽样，一些样本可能在同一训练集中出现多次，一些可能被忽略
过程：
输入：训练集 D={(x1, y1), (x2, y2), (x3, y3), …(xm, ym)};
基学习算法#（网络模型net）;
训练轮数T.
过程：
1：for t = 1, 2, 3,…T do
2： ht = net(D,Dbs)
3：end for
输出：H(x) = arg max…
对于分类，输出使用简单投票法，若两个类收到同样票数，就随机选择一个；
对于回归，使用简单平均法，对于不同模型结果进行平均。

bagging主要用来减小variance

集成学习之Bagging