机器学习-朴素贝叶斯分类

朴素贝叶斯有一个条件独立性,所以称为朴素。

朴素贝叶斯的思想:贝叶斯学派的四件可以概括为:先验概率+数据=后验概率

贝叶斯

随着信息增加,贝叶斯定理可以用于更新假设的概率。在决策理论中,贝叶斯推断与主观概率密切相关,通常被称为“Bayesian probability(贝叶斯概率)”。

贝叶斯推断根据 prior probability(先验概率) 和统计模型导出的“likelihood function(似然函数)”的结果,再由贝叶斯定理计算 posterior probability(后验概率):

P(H|E)=P(E|H)P(H)P(E)

P(H) – 已知的先验概率
P(H|E) – 我们想求的后验概率,即在B事件发生后对于事件A概率的评估
P(E|H) – 在事件H下观测到E的概率
P(E) – marginal likelihood(边际似然),对于所有的假设都是相同的,因此不参与决定不同假设的相对概率
P(E|H)/P(E) – likelihood function(可能性函数),这是一个调整因子,通过不断的获取信息,可以使得预估概率更接近真实概率

分类方法是一种基于统计学思想的方法。

朴素贝叶斯原理:

机器学习-朴素贝叶斯分类

条件概率是朴素贝叶斯的基石。

机器学习-朴素贝叶斯分类

后验概率最大化等价推导 

机器学习-朴素贝叶斯分类

朴素贝叶斯分类器流程 

机器学习-朴素贝叶斯分类

 

朴素贝叶斯分类器性能

朴素贝叶斯的优点:对小规模的数据表现很好,适合多分类任务,适合增量式训练

朴素贝叶斯的缺点:对输入数据的表达形式很敏感

信息来源:

1.DC学院

2.https://blog.csdn.net/syoya1997/article/details/78618885