机器学习与深度学习系列连载：第一部分机器学习（十三）半监督学习（semi-supervised learning）

在实际数据收集的过程中，带标签的数据远远少于未带标签的数据。我们据需要用带label 和不带label的数据一起进行学习，我们称作半监督学习。

Transductive learning：没有标签的数据是测试数据
Inductive learning：没有标签的数据不是测试数据

为什么没有标签的数据会帮助我们学习呢？是因为没有标签数据的分布可能会告诉我们一些潜在的规律。

1.半监督生成模型 Semi-supervised Learning for Generative Model

我们回忆一下监督学习的生成模型，计算先验概率，然后通过概率模型估计，计算分类概率。
机器学习与深度学习系列连载：第一部分机器学习（十三）半监督学习（semi-supervised learning）
那半监督的概率生成模型是：

寻找概率最大的 $P(C_{i})$ 和 $P(x|C_{i})$
$P(x|C_{i})$ 符合高斯分布

算法流程如下，但是最后的结果影响与初始值的初始化，结构和EM算法类似

2. 低密度分割 Low-density Separation

大原则：非黑即白
（1）Self-training
机器学习与深度学习系列连载：第一部分机器学习（十三）半监督学习（semi-supervised learning）

（2）Entropy-based Regularization
我们估计的分布函数，如何衡量他的好坏

所以我们让他越小越好：

考虑到了Entropy因素，Loss函数最后可以写成
机器学习与深度学习系列连载：第一部分机器学习（十三）半监督学习（semi-supervised learning）