聚类分析----模式相似性测度

用于描述各模式间的相似程度。在这里,特征点是矢量的失端。

距离测度(差值测度)

以两个矢量失端的距离作为的距离作为度量的的基础,是两矢量各相应分量之差的函数。

欧式距离

聚类分析----模式相似性测度;其中x,y为两个矢量,d(x,y)为他们的距离(下文同)。

实际中较多地使用欧氏距离,因为只有欧式距离具有平移和旋转不变性。

绝对值距离

聚类分析----模式相似性测度

切氏距离

聚类分析----模式相似性测度

明氏距离

聚类分析----模式相似性测度

可以看出上面几个分别是m=2,1,∞的特殊情况。

 

马氏距离

先说下协方差矩阵

聚类分析----模式相似性测度

聚类分析----模式相似性测度

以上关于协方差矩阵的内容转自:https://blog.****.net/yangleo1987/article/details/52845912

下面说回马氏距离

设xi,xj是矢量集{x1,x2,...,xm}中的两个矢量,他们的马氏距离d定义为:

聚类分析----模式相似性测度

式中:

聚类分析----模式相似性测度

聚类分析----模式相似性测度

容易证明,马氏距离对一切非奇异线性变换都是不变的,这说明它不受特征量纲的影响,并且是平移不变的;V的含义是一个失良集的样本协方差矩阵。

一般来讲,若x,y是从期望矢量为聚类分析----模式相似性测度,协方差矩阵为聚类分析----模式相似性测度的母体G中抽取的两个样本,它们间的马氏距离d定义为:

聚类分析----模式相似性测度

聚类分析----模式相似性测度

相似测度

以两矢量的方向是否相近作为度量的基础

角度相似系数

聚类分析----模式相似性测度

匹配测度

Tanimoto测度

聚类分析----模式相似性测度

其中a为x,y(1-1)匹配的特征数目,b为(0-1),c为(1-0)