数据挖掘——隐马尔可夫模型(HMM)和Viterbi算法
只是简单理解、回顾一下。
1. 马尔科夫链/模型(Markov Chain / Model)
简单来讲就是,从一个状态(state)到另一个状态的过程,并且当前状态只与上一个状态有关。
举个例子,有小学、初中、高中、大学、工作这几个状态。而从大学状态跳到工作这个状态时,HR基本上只关心你的大学,而不会问你在哪所高中、初中毕业。
所以说人类的本质就是马尔科夫模型。
2. 隐马尔科夫链/模型(Hidden Markov Chain)
顾名思义,就是隐藏在马尔科夫链各状态中的其他状态,因为有很多种可能性、可能会发生也可能不发生,所以具体发生的是哪个状态我们也看不见,所以叫“隐藏”(Hidden)。
还是上面那个例子,假如说隐藏状态是“恋爱”或者“打架”,小孩子们自己瞒着所以我们也看不见,这就是被隐藏的状态。
所以到底是去做什么了(或者预测),这就是概率和怎么算的问题了。而Viterbi算法就是帮助我们根据不同状态之间转换的概率,知道小孩到底在干嘛的算法。是不是很牛逼。