数据挖掘之EM算法总结

EM算法用来求解具有隐变量的模型参数估计问题,‘隐变量’问题网上最常见的例子就是掷两枚硬币抽样男女学生身高问题,可以自己看看。

EM算法的过程及其推导如下3:
数据挖掘之EM算法总结

数据挖掘之EM算法总结

EM的应用:高斯混合模型(GMM)
数据挖掘之EM算法总结
弄清楚隐变量:
数据挖掘之EM算法总结
写出完全数据的对数似然函数,然后求对数似然函数的期望得到Q函数,求使Q函数极大对应的参数

EM的应用:Kmeans聚类:
首先回顾下kmeans的过程。。
数据挖掘之EM算法总结

E : 给每个样本指定一个类别

M : 根据指定的类别调整参数(我的理解这里就是调整各个类别的质心)