adaboost

AdaBoost的一般流程

（1）收集数据：可以使用任何方法；

（2）准备数据：依赖于所使用的若分类器类型；

（3）分析数据：可以使用任意方法

（4）训练算法：AdaBoost的大部分时间都用在训练上，分类器将多次在同一数据集上训练若分类器；

（5）测试算法：计算分类的错误率；

（6）使用算法：同SVM一样，AdaBoost预测的两个类别中的一个，如果想要把它应用到多个类的场合，那么就像多类SVM中的做法一样对AdaBoost进行修改。

AdaBoost

优点泛化错误率低，易编码，可以应用在大部分分类器上，无需参数调整

缺点对离群点敏感

适合数据类型数值型和标称型数据

2.训练算法：基于错误提升分类器的性能

AdaBoost是adaptive
boosting（自适应boosting）的缩写，其运行过程：训练集中的每个样本，赋予其一个权重，这些权重构成向量D。一开始，这些权重都初试化成相等值。首先在训练数据上训练处一个若分类器并计算该分类器的错误率，然后在同一数据集上再次训练若分类器。在分类器的第二次训练当中，将会重新调整每个样本的权重，其中第一次分队的样本的权重值将会降低，而第一次分错的样本的权重将会提高。为了从所有分类器中得到最终的分类结果，AdaBoost为每个分类器都分配了一个权重值alpha，这些alpha值是基于每个分类器的错误率进行计算的。其中错误率定义为

adaboost