《数学之美》笔记

第五章、隐含马尔可夫模型 P76

隐含马尔可夫模型历史 P79，马尔可夫假设：随机过程中各个状态St的概率分布，只与它的前一个状态St-1有关。符合这个假设的随机过程则称为马尔可夫过程，也称为马尔科夫链。

隐含马尔可夫模型：

《数学之美》笔记

公式推导：

《数学之美》笔记

将（5.5）代入（5.3），正好得到（5.4）。

二、隐含马尔可夫模型的训练 P82

《数学之美》笔记

第三个问题中：用鲍姆-韦尔奇算法（Baum-Welch Algorithm）P84

第六章信息的度量和作用

1 信息熵

信息量就等于不确定性的多少

《数学之美》笔记

第十四章余弦定理和新闻的分类 P155

第十五章矩阵运算和文本处理中的两个分类问题 P164

利用矩阵运算中的奇异值分解（Singular Value Decomposition，SVD）

三个小矩阵各自含义的解释 P166

第一个矩阵X是对词进行分类的一个结果，它的每一行表示一个词，每一列表示一个语义相近的词类，或者简称为语义类。

最后一个矩阵Y是对文本的分类结果。它的每一列对应一个文本，每一行对应一个主题。

中间的矩阵则表示词的类和文章的类之间的相关性。

第二十章谈谈最大熵模型

最大熵原理指出，需要对一个随机事件的概率分布进行预测时，我们的预测应当满足全部已知的条件，而对未知的情况不要做任何主观假设。在这种情况下，概率分布最均匀，预测的风险最小。因为这时概率分布的信息熵最大，所以人们称这种模型叫“最大熵模型”。

最大熵模型：一个指数函数

《数学之美》笔记

第二十四章马尔可夫链的扩展——贝叶斯网络

emmm，在看这一章之前听过朴素贝叶斯，自己又百度了一下~贴个网址哈：

第二十五章条件随机场和句法分析