机器学习笔记(IX)线性模型(V)多分类学习
拆解法
多分类问题的一般方法,是将多分类任务拆分为多个二分类任务求解,这里设有
具体做法
1:将多分类问题拆解为若干个二分类问题
2:为每个二分类问题训练一个分类器
3:得出每个二分类问题的预测结果
4:对这些二分类问题的结果进行集成最后得到多分类结果
拆分策略
给定数据集:
拆分方法如下:
OvO
“一对一”
将
图解
OvR
每次将一个类的样例作为正例,其他类的样例作为反例来训练
OvO 和OvR 的比较
分类器个数:
分类器的样例:
时间开销:
在类别比较少的情况下:
在类别比较多的情况下:
MvM
做法
每次将若干个类作为正类,其他若干个类作为反类。
纠错输出码ECOC
编码:
对
解码:
编码矩阵
“+1”和“-1”分别表示学习器
主要形式:
ECOC 码的性质
一般来说:在同一个学习任务中
码长度
对同等长度的编码,任意两个类别之间的编码距离越远,则纠错能力越强。