李宏毅机器学习笔记3-机器学习中的错误来源(bias和variance)

bias(偏差)和variance(方差)

一 什么是bias和variance
bias是瞄错了靶心,variance是射偏的程度。

李宏毅机器学习笔记3-机器学习中的错误来源(bias和variance)
次方越多,越贴近于train data,所以bias越小,但是,由于train data中的数据间的差异更大,所以variation越大。
次方越少,越适用于test data,但是就像瞄靶心一样,瞄远了,这个时候bias大,但是不贴近train data,所以vacation小。
李宏毅机器学习笔记3-机器学习中的错误来源(bias和variance)
二 两种对应的应对方法
怎么知道自己是bias大还是vacation大:
如果你的model无法fit你的train data 数据,说明你的bias大,此时,欠拟合如下图:
李宏毅机器学习笔记3-机器学习中的错误来源(bias和variance)
反之,你的model很fit你的train data 数据,但是和你的test data非常不fit,说明variation,此时,过拟合。

bias大时候如何提升你的算法:
如下图
李宏毅机器学习笔记3-机器学习中的错误来源(bias和variance)
重新设计模型,可以考虑更多的参数,加入更多的次方。

*variation大时候如何提升你的算法:*如下
李宏毅机器学习笔记3-机器学习中的错误来源(bias和variance)
使用更多的训练数据,使用正则化(使得曲线更加的平滑,会往中心靠,可能会伤害你的bias)。