第七章 机器学习

概念

.(机器学习系统)利用经验来改善计算机系统自身的性能。

机器学习是一种归纳。
专家系统(计算机推理)采用的是反向、演绎。

第七章 机器学习
第七章 机器学习

一、监督学习

1.1 运行过程

第七章 机器学习

1.2 典型算法

1.2.1 K近邻算法

– 给定一个训练数据集,无需训练

– 对新的输入实例,在训练数据集中
找到与该实例最邻近的K个实例

– 根据这K个实例的类别做投票,哪
个类的实例最多,就把该输入实例
分类到这个类中

例子:

第七章 机器学习

1.2.2 决策树算法

规则归纳问题,适合用决策树来表示

如果一个属性执行后,使得数据集上的信息增益最大(最有序),则该属性应该优先被执行(更接近根节点)
第七章 机器学习

1.2.3 支持向量机

第七章 机器学习
第七章 机器学习

二、无监督学习

2.1 特点

无监督学习更接近人类学习的过程:

• 有明确的学习目标
• 有样本数据
• 不需人工标注知识
• 提升难度大

2.2 聚类(“归堆”)

第七章 机器学习

– 聚类算法最终要求将样本数据唯一、确定地划为某一类别。

– 不同类别之间样本不交叉。

– 同一类别内部样本具有较高相似度。

– 不同类别之间样本相似度较低

2.3 典型算法

2.3.1 K-means聚类算法

关键问题:距离计算方法。

– 聚类大量依赖于距离或者相似度计算。因此确定一种距离非常重要。
第七章 机器学习

2.3.2 自动编码器

– 原始数据经过神经网络“编码”,再根据编码信息“解码”,还原原有信息。

– 适应大量样本后,编码器本身能够表示关于问题的本质特征。

应用:

1️⃣图像抗噪

第七章 机器学习

2️⃣数据降维

– 原始数据生成的模型往往仍然规模比较大

– 此时可以使用自动编码器做一次降维,不损失信息的情况下,降低空间使用

第七章 机器学习

三、弱监督学习

第七章 机器学习

3.1 半监督学习

– 一部分数据带有人工标记知识

– 另一部分数据无标记

– 通过学习有标记数据,逐渐扩展无标记数据

实例

实例一:远距离监督用于关系抽取

第七章 机器学习
第七章 机器学习

实例二:社交网络上的半监督学习

第七章 机器学习

第七章 机器学习

3.2 迁移学习(计算机的举一反三)

– 任务A 与 任务B 具有某种相似性

– 利用任务A的学习经验,解决任务B

– 即迁移学习。
第七章 机器学习

实例

实例一:图像风格的迁移学习

• 给定某种风格的图画样本,如梵高油画集合

• 训练模型,能够表达梵高图片中的某些风格

• 给定不具有该风格的图像

• 不改变内容,仅将梵高风格添加到图片中

第七章 机器学习

四、强化学习

4.1 强化学习的基本思想

强化学习(Reinforcement Learning, RL) 并不是一个独立的方法而是一种机器学习的模式,或者说是一种思路。

– 强化学习认为,计算机单纯通过感知环境,与环境交互,并且从交互中获得评价反馈,就可以适应所处的环境。从我们看来,就相当于计算机学习得到了环境下的某些知识,实现了机器学习。

第七章 机器学习
第七章 机器学习

第七章 机器学习

4.2 实例

实例一:小孩子学走路

第七章 机器学习
第七章 机器学习

实例二:旅行商问题

第七章 机器学习
第七章 机器学习

4.3 应用

4.3.1 自动驾驶

第七章 机器学习

4.3.2 AI游戏和电子竞技

第七章 机器学习

4.3.3 虚拟生命的建模

第七章 机器学习