如何在python中找到Kmeans ++聚类的拟合程度
答
标准k-means是硬聚类算法,即没有拟合度;数据点属于一个且仅有一个群集。以下是来自相关academic paper的报价(强调增加):
2.3.1。 硬k均值
[...]
在K-均值聚类只二价隶属度对象的我到 簇ķ被允许:λ[I,K]∈{ 0,1}。如果一个对象我是 簇的成员它不可能是任何其它集群的成员
K-means++只是用于选择对k均值的初始值(种子)的算法,它并没有改变k-means作为硬聚类算法的基本特征。
答
有k-means允许的“软”变种。
特别是模糊C均值(不要问我为什么他们用c代替k的...)
但要注意的是,所得的软质分配远非统计概率。这只是一个基于平方距离给出一些相对权重的数字,不包括任何强大的统计模型。