孙仕亮模式识别与机器学习0917第一堂课
第一堂课PPT链接: https://pan.baidu.com/s/1J3CAOMJd8843F6lPXoa3Ng 密码: u44i
第一堂课PDF链接: https://pan.baidu.com/s/1DCw6OiXyrJwV5DgW2rt4Gw 密码: p6mt
笔记:
第一页
第二页
第三页
知识点整理
(1)监督学习、半监督学习、主动学习、迁移学习。- 监督学习:使用已知正确答案的示例来训练网络的。
- 半监督学习:在训练阶段结合了大量未标记的数据和少量标签数据。
- 主动学习:在某些情况下,没有类标签的数据相当丰富而有类标签的数据相当稀少,并且人工对数据进行标记的成本又相当高昂。在这种情况下,我们可以让学习算法主动地提出要对哪些数据进行标注,之后我们要将这些数据送到专家那里让他们进行标注,再将这些数据加入到训练样本集中对算法进行训练,这一过程叫做主动学习。
- 迁移学习:训练好一个网络(我们称它为base network)→把它的前n层复制到target network的前n层→target network剩下的其他层随机初始化→开始训练target task。
(2)先验概率、后验概率
- 先验概率(Prior Probability):P(B) 即B事件发生的概率
- 后验概率(Posterior Probability)????(B|F) 即在F事件发生的条件下B事件发生的概率
举个栗子:
小明:我手里有个水果,猜猜是什么水果。(这时是苹果的概率就是P(B))
小明:我手中有个说过是圆形的,猜猜是什么水果。(这时是苹果的概率就是P(B|F))
(3)
训练集(training set) | 验证集(validation set) | 测试集(test set) |
---|---|---|
训练参数 | 选择参数 | 性能评估 |
(4)范数:第0范数、第二范数、第三范数
- L0范数:指向量中非0的元素的个数。
- L1范数:指向量中各个元素绝对值之和。
- L2范数:L2范数是指向量各元素的平方和然后求平方根。它的回归叫“岭回归”,也叫它“权值衰减”,可以防止过拟合。
为什么使用范数:当数据量小的时候最好选择简单的模型,选择复杂的模型容易造成过拟合。但我们的数据量小并且想用复杂模型的时候,添加范数约束可以实现。
(5)极大似然估计和贝叶斯估计:https://blog.****.net/zengxiantao1994/article/details/72787849