Adaboost(监督学习)

集成方法在函数模型上等价于一个多层神经网络,两种常见的集成方法为Adaboost模型RandomTrees模型。其中随机森林可被视为前馈神经网络,而Adaboost模型则等价于一个反馈型多层神经网络。

一.引入

         对于Adaboost,可以说是久闻大名,据说在Deep Learning出来之前,SVM和Adaboost是效果最好的 两个算法,而Adaboost是提升树(boosting tree),所谓“ 提升树 ” 就是把“弱学习算法”提升(boost)为“强学习算法”(语自《统计学习方法》),而其中最具代表性的也就是Adaboost了,貌似Adaboost的结构还和Neural Network有几分神似,我倒没有深究过,不知道是不是有什么干货。

二.过程

        Adaboost(监督学习)(from PRML)

         这就是Adaboost的结构,最后的分类器YM是由数个弱分类器(weak classifier)组合而成的,相当于最后m个弱分类器来投票决定分类,而且每个弱分类器的“话语权”α不一样。

         这里阐述下算法的具体过程:

        1.初始化所有训练样例的权重为1 / N,其中N是样例数

        2.for m=1,……M:

               a).训练弱分类器ym(),使其最小化权重误差函数(weighted error function)

            Adaboost(监督学习)

               b)接下来计算该弱分类器的话语权α:

                                                 Adaboost(监督学习)

               c)更新权重:

                                           Adaboost(监督学习)

                             其中Zm:

                                                 Adaboost(监督学习)

                             是规范化因子,使所有w的和为1。(这里公式稍微有点乱)

           3.得到最后的分类器:

                              Adaboost(监督学习)

三.原理


             可以看到整个过程就是和最上面那张图一样,前一个分类器改变权重w,同时组成最后的分类器
             如果一个训练样例 在前一个分类其中被误分,那么它的权重会被加重,相应地,被正确分类的样例的权重会降低
             使得下一个分类器 会更在意被误分的样例,那么其中那些α和w的更新是怎么来的呢?
             下面我们从前项分步算法模型的角度来看看Adaboost:
             直接将前项分步加法模型具体到adaboost上:
                                  Adaboost(监督学习)
              其中 fm是前m个分类器的结合
                                   Adaboost(监督学习)
              此时我们要最小化E,同时要考虑α和yl,
              但现在我们假设前m-1个α和y都已经fixed了:那么
                                   Adaboost(监督学习)
               其中Adaboost(监督学习),可以被看做一个常量,因为它里面没有αm和ym:
               接下来:
                                   Adaboost(监督学习)
               其中Tm表示正分类的集合,Mm表示误分类的集合,这一步其实就是把上面那个式子拆开,没什么复杂的东西
               然后就是找ym了,就是最小化下式的过程,其实就是我们训练弱分类器
                                                Adaboost(监督学习)
               有了ym,α也就可以找了,然后继续就可以找到更新w的公式了(注意这里得到的w公式是没有加规范化因子Z的公式,为了计算方便我们加了个Z进去)
             

四.实现

C++:http://blog.****.net/u012319493/article/details/53103192

python:

集成算法 实例:

http://blog.****.net/mlljava1111/article/details/50765517

adaboost python 实例:

http://blog.****.net/u014114990/article/details/51178899

https://github.com/justdark/dml/tree/master/dml