模式识别学习笔记(9)——非参数方法
非参数概率密度估计
概率:特征空间中一定区域内样本的比率。
密度:局部区域内概率的平均值(假设局部区域【体积为V,样本数为k】内等概率密度)
pn(x)表示对p(x)的第n次估计
非参数概率密度估计
parzen window:固定局部区域体积V,k变化
k-nearest neighbor:固定局部样本数k,V变化
parzen window
-窗函数
1、满足条件
比如高斯函数,就是满足该条件的窗函数
2、
(why?)
3、
k近邻估计
1维:
x到x-k近邻的两倍!!!
ki:来自第i个类别的个数
第二个公式:联合概率密度
第三个公式:后验概率
最近邻规则(k=1)
测试样本点x在集合中距离其最近的点记为x’
每个样本都有一个局部区域
加*表示贝叶斯的错误率
参考资料:
中国科学院大学硕士课《模式识别》ppt