人工智能学习笔记-什么是机器学习
什么是机器学习
1.1 机器学习的本质
1.2机器学习VS 专家规则
1.3. 机器学习基本原理
1.4. 机器学习的类别
1.1. 本质
根据历史看到的样本,总结规律。
1.2. 机器学习 VS 专家规则
机器学习VS 专家规则
机器学习 |
专家规则 |
说明 |
|
样本 |
全量样本 |
抽样样本 (优点:最少数据获得最多信息 |
|
规律 |
海量规则 (特征更多,规律更精细) |
几百条规则 |
规则: 特征的多少决定了分类的个数 |
总结 |
机器总结 (能够看海量样本,总结海量规则的核心原因) |
专家总结 |
|
收纳尽可能多的数据,挖掘长尾价值 |
选取最有效的数据,发挥头部价值 |
1.3. 机器学习基本原理
定义一个损失函数(错误率),尝试所有的划分方法,取损失函数最小的划分方法。
举例说明:Linear Regression(单变量线性回归)
步骤 |
函数 |
含义 |
公式 |
说明 |
1 |
假设函数 |
模型 |
x是特征 |
|
2 |
损失函数 |
衡量预测值和真实值的差距 |
求解θ0,θ1, |
|
3 |
梯度下降法 |
找到损失函数的局部极小值点 |
实际问题
问题 |
解决方法 |
穷举划分方法,导致计算量太大 |
Mini batch |
过拟合 |
正则惩罚 |
1.4. 机器学习的类别
图片来自于:https://morvanzhou.github.io/tutorials/machine-learning/sklearn/
如上图所示,机器学习的类别,可以划分为几部分。
特点 |
类别 |
举例 |
||
机器学习 |
监督学习 |
有标签(Label) |
分类(Classification) |
预测明天会不会下雨 |
回归(Regression) |
通过房屋面积预测房价 |
|||
无监督学习 |
无标签(Label) |
聚类(Clustering) |
已知学生出勤率和作业质量,为学生聚类 得到结果,把学生分类几类 |
|
降维(Dimensionality Reduction) |
||||
强化学习 |
计算机在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的行为。 |
简单监督神经网络: 快棋手 复杂监督神经网络: 慢棋手 强化学习神经网络:左右互博,最大化最后的奖励 |