孙仕亮模式识别与机器学习0917第一堂课

第一堂课PPT链接: https://pan.baidu.com/s/1J3CAOMJd8843F6lPXoa3Ng 密码: u44i
第一堂课PDF链接: https://pan.baidu.com/s/1DCw6OiXyrJwV5DgW2rt4Gw 密码: p6mt

笔记:

第一页

孙仕亮模式识别与机器学习0917第一堂课

第二页

孙仕亮模式识别与机器学习0917第一堂课

第三页

孙仕亮模式识别与机器学习0917第一堂课

知识点整理

(1)监督学习、半监督学习、主动学习、迁移学习。
  1. 监督学习:使用已知正确答案的示例来训练网络的。
  2. 半监督学习:在训练阶段结合了大量未标记的数据和少量标签数据。
  3. 主动学习:在某些情况下,没有类标签的数据相当丰富而有类标签的数据相当稀少,并且人工对数据进行标记的成本又相当高昂。在这种情况下,我们可以让学习算法主动地提出要对哪些数据进行标注,之后我们要将这些数据送到专家那里让他们进行标注,再将这些数据加入到训练样本集中对算法进行训练,这一过程叫做主动学习。
  4. 迁移学习:训练好一个网络(我们称它为base network)→把它的前n层复制到target network的前n层→target network剩下的其他层随机初始化→开始训练target task。

(2)先验概率、后验概率

  1. 先验概率(Prior Probability):P(B) 即B事件发生的概率
  2. 后验概率(Posterior Probability)????(B|F) 即在F事件发生的条件下B事件发生的概率
    举个栗子:
    小明:我手里有个水果,猜猜是什么水果。(这时是苹果的概率就是P(B))
    小明:我手中有个说过是圆形的,猜猜是什么水果。(这时是苹果的概率就是P(B|F))

(3)

训练集(training set) 验证集(validation set) 测试集(test set)
训练参数 选择参数 性能评估

(4)范数:第0范数、第二范数、第三范数

  1. L0范数:指向量中非0的元素的个数。
  2. L1范数:指向量中各个元素绝对值之和。
  3. L2范数:L2范数是指向量各元素的平方和然后求平方根。它的回归叫“岭回归”,也叫它“权值衰减”,可以防止过拟合。

为什么使用范数:当数据量小的时候最好选择简单的模型,选择复杂的模型容易造成过拟合。但我们的数据量小并且想用复杂模型的时候,添加范数约束可以实现。

(5)极大似然估计和贝叶斯估计:https://blog.****.net/zengxiantao1994/article/details/72787849