【机器学习算法】:极大似然估计
1.极大似然估计在什么情况下用
step1:已知一个模型(比如逻辑回归模型,线性回归模型)。
step2:给定已知的数据集D。
step3:用极大似然估计来估计step1中模型的参数。
step4:得到参数后,模型就完整啦~ 可以用完整的模型对未来的结果进行预测。
2.为什么可以用极大似然估计来估计模型中的参数
似然函数定义:
假设数据集D服从一个参数为w的概率分布(含义就是知道w的条件下,数据集D取样本x的概率),表示的是数据集D的联合概率分布,基于我们的独立性假设,该值为所有样本的概率密度函数的乘积。我们将称为参数w的似然函数。为参数w的对数似然函数,记作。
Note:之所以取对数是因为后续会对似然函数求导,取对数后方便求导(对数运算将乘法变成了加法)-
最大化似然函数估计参数
为什么我们可以通过最大化似然函数来估计模型参数呢。主要原因在于:样本数据集D是已经出现的状态,所以我们可以认为,D出现的概率比所有其他样本数据集D’出现的概率都要大,就是说。所以说用极大似然估计得到一个参数w。