机器学习学习笔记(一)

机器学习学习笔记(一)

学习网易云课堂中的李宏毅机器学习中文课程的学习心得,链接自取:链接

研究生学习第一课

机器学习学习笔记(一)

图1

简单的model虽然的f相差不多,但与靶心fˉ相差太远,复杂的model每次的f虽然不一样相差很多,但是均值E[f*]却=fˉ,
机器学习学习笔记(一)
Bias是指与中心点函数的(正确值)的误差,model的bias从Large->Small,bais所造成的的Error是逐渐下降的,但是同时因为函数的次数越来越复杂使得variance所造成的Error却是越来越大。
机器学习学习笔记(一)

图2

总结:就是虽然瞄得越来越准,但是误差越来越大。所以需要找到一个平衡点,否则会出现underfitting与overfitting的现象。
机器学习学习笔记(一)

图3
  1. 如果你的model不能fit the training examples,如上图3所示,则是Bias大的情况。备注:往左是Bais大,使得造成underfitting。
  2. 如果是可以fit the training examples,但是在你的the training data上面得到Large的Error的曲线值,则需要考虑的就是Large Variance的情况的发生。备注:往右是Variance大(增加考虑的输入参数),使得造成overfitting。

机器学习学习笔记(一)

图4

分析:为了保证在public Testing Set,特别是private Testing Set有着更好的表现,所以在选择Model时,需要将Training Set的Data分为三份,用其中某两份Data进行Train,最后算出Avg Err,从而比较得出最优的Model,再去测试public Testing Set与private Testing Set。