模式识别学习笔记(9)——非参数方法

非参数概率密度估计


概率:特征空间中一定区域内样本的比率。

密度:局部区域内概率的平均值(假设局部区域【体积为V,样本数为k】内等概率密度)

模式识别学习笔记(9)——非参数方法

模式识别学习笔记(9)——非参数方法

pn(x)表示对p(x)的第n次估计



非参数概率密度估计

parzen window:固定局部区域体积V,k变化

k-nearest neighbor:固定局部样本数k,V变化


parzen window

-窗函数
模式识别学习笔记(9)——非参数方法模式识别学习笔记(9)——非参数方法
1、满足条件
模式识别学习笔记(9)——非参数方法
比如高斯函数,就是满足该条件的窗函数
2、
模式识别学习笔记(9)——非参数方法(why?)
3、
模式识别学习笔记(9)——非参数方法
模式识别学习笔记(9)——非参数方法
模式识别学习笔记(9)——非参数方法
模式识别学习笔记(9)——非参数方法

k近邻估计

模式识别学习笔记(9)——非参数方法
1维:
模式识别学习笔记(9)——非参数方法
x到x-k近邻的两倍!!!

模式识别学习笔记(9)——非参数方法
ki:来自第i个类别的个数
第二个公式:联合概率密度
第三个公式:后验概率

最近邻规则(k=1)
模式识别学习笔记(9)——非参数方法
测试样本点x在集合中距离其最近的点记为x’
每个样本都有一个局部区域
模式识别学习笔记(9)——非参数方法
模式识别学习笔记(9)——非参数方法
模式识别学习笔记(9)——非参数方法
加*表示贝叶斯的错误率
模式识别学习笔记(9)——非参数方法


参考资料:

中国科学院大学硕士课《模式识别》ppt