机器学习入门(二) — 回归模型 (理论)

讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法
机器学习入门(二) — 回归模型 (理论)

1 预测房价

1.1 通过相似的房子预测你的房子

机器学习入门(二) — 回归模型 (理论)
机器学习入门(二) — 回归模型 (理论)

2 线性回归

2.1 应用线性回归模型

机器学习入门(二) — 回归模型 (理论)
机器学习入门(二) — 回归模型 (理论)
机器学习入门(二) — 回归模型 (理论)

那么哪条线才是最好的呢?

2.2 应用一条线的成本

机器学习入门(二) — 回归模型 (理论)

2.3 预测你的房价

机器学习入门(二) — 回归模型 (理论)

3 加入更高阶的因素

3.1 用直线拟合房价或者...?

机器学习入门(二) — 回归模型 (理论)

3.2 如果用二次函数怎么样?

机器学习入门(二) — 回归模型 (理论)

3.3 更高阶的多项式

机器学习入门(二) — 回归模型 (理论)

4 你相信这个模型吗?

显然,相比二次函数并不好!!!
过拟合
机器学习入门(二) — 回归模型 (理论)

5 通过训练-测试分离来评估过拟合

你相信这个拟合吗?

机器学习入门(二) — 回归模型 (理论)

二次函数怎么样呢

机器学习入门(二) — 回归模型 (理论)

如何选择模型阶数 / 复杂度

机器学习入门(二) — 回归模型 (理论)

训练 / 测试分离

机器学习入门(二) — 回归模型 (理论)

  • 训练集
    用于模型构建
  • 测试集
    用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率

训练误差

  • 蓝色点为训练集数据
    机器学习入门(二) — 回归模型 (理论)

测试误差

机器学习入门(二) — 回归模型 (理论)

6 训练测试曲线

机器学习入门(二) — 回归模型 (理论)

7 加入新的特征

仅仅通过房屋大小预测

机器学习入门(二) — 回归模型 (理论)

加入其他的特征

机器学习入门(二) — 回归模型 (理论)

应该选择多少特征

机器学习入门(二) — 回归模型 (理论)

8 其他回归示例

薪资预测

机器学习入门(二) — 回归模型 (理论)
机器学习入门(二) — 回归模型 (理论)

股票预测

机器学习入门(二) — 回归模型 (理论)

微博流行度

机器学习入门(二) — 回归模型 (理论)

智能房屋

机器学习入门(二) — 回归模型 (理论)

9 回归总结

机器学习流水线
机器学习入门(二) — 回归模型 (理论)
机器学习入门(二) — 回归模型 (理论)