聚类分析----模式相似性测度
用于描述各模式间的相似程度。在这里,特征点是矢量的失端。
距离测度(差值测度)
以两个矢量失端的距离作为的距离作为度量的的基础,是两矢量各相应分量之差的函数。
欧式距离
;其中x,y为两个矢量,d(x,y)为他们的距离(下文同)。
实际中较多地使用欧氏距离,因为只有欧式距离具有平移和旋转不变性。
绝对值距离
切氏距离
明氏距离
可以看出上面几个分别是m=2,1,∞的特殊情况。
马氏距离
先说下协方差矩阵
以上关于协方差矩阵的内容转自:https://blog.****.net/yangleo1987/article/details/52845912
下面说回马氏距离
设xi,xj是矢量集{x1,x2,...,xm}中的两个矢量,他们的马氏距离d定义为:
式中:
容易证明,马氏距离对一切非奇异线性变换都是不变的,这说明它不受特征量纲的影响,并且是平移不变的;V的含义是一个失良集的样本协方差矩阵。
一般来讲,若x,y是从期望矢量为,协方差矩阵为
的母体G中抽取的两个样本,它们间的马氏距离d定义为:
相似测度
以两矢量的方向是否相近作为度量的基础
角度相似系数
匹配测度
Tanimoto测度
其中a为x,y(1-1)匹配的特征数目,b为(0-1),c为(1-0)