第七章 机器学习
概念
.(机器学习系统)利用经验来改善计算机系统自身的性能。
机器学习是一种归纳。
专家系统(计算机推理)采用的是反向、演绎。
一、监督学习
1.1 运行过程
1.2 典型算法
1.2.1 K近邻算法
– 给定一个训练数据集,无需训练
– 对新的输入实例,在训练数据集中
找到与该实例最邻近的K个实例
– 根据这K个实例的类别做投票,哪
个类的实例最多,就把该输入实例
分类到这个类中
例子:
1.2.2 决策树算法
规则归纳问题,适合用决策树来表示
如果一个属性执行后,使得数据集上的信息增益最大(最有序),则该属性应该优先被执行(更接近根节点)
1.2.3 支持向量机
二、无监督学习
2.1 特点
无监督学习更接近人类学习的过程:
• 有明确的学习目标
• 有样本数据
• 不需人工标注知识
• 提升难度大
2.2 聚类(“归堆”)
– 聚类算法最终要求将样本数据唯一、确定地划为某一类别。
– 不同类别之间样本不交叉。
– 同一类别内部样本具有较高相似度。
– 不同类别之间样本相似度较低
2.3 典型算法
2.3.1 K-means聚类算法
关键问题:距离计算方法。
– 聚类大量依赖于距离或者相似度计算。因此确定一种距离非常重要。
2.3.2 自动编码器
– 原始数据经过神经网络“编码”,再根据编码信息“解码”,还原原有信息。
– 适应大量样本后,编码器本身能够表示关于问题的本质特征。
应用:
1️⃣图像抗噪
2️⃣数据降维
– 原始数据生成的模型往往仍然规模比较大
– 此时可以使用自动编码器做一次降维,不损失信息的情况下,降低空间使用
三、弱监督学习
3.1 半监督学习
– 一部分数据带有人工标记知识
– 另一部分数据无标记
– 通过学习有标记数据,逐渐扩展无标记数据
实例
实例一:远距离监督用于关系抽取
实例二:社交网络上的半监督学习
3.2 迁移学习(计算机的举一反三)
– 任务A 与 任务B 具有某种相似性
– 利用任务A的学习经验,解决任务B
– 即迁移学习。
实例
实例一:图像风格的迁移学习
• 给定某种风格的图画样本,如梵高油画集合
• 训练模型,能够表达梵高图片中的某些风格
• 给定不具有该风格的图像
• 不改变内容,仅将梵高风格添加到图片中
四、强化学习
4.1 强化学习的基本思想
强化学习(Reinforcement Learning, RL) 并不是一个独立的方法而是一种机器学习的模式,或者说是一种思路。
– 强化学习认为,计算机单纯通过感知环境,与环境交互,并且从交互中获得评价反馈,就可以适应所处的环境。从我们看来,就相当于计算机学习得到了环境下的某些知识,实现了机器学习。