聚类算法小结

聚类算法就是按照某个特定的标准(如距离准则)把一个数据集分割成不同的类或簇,使得同个簇内的数据对象相似性尽可能大,同时不同簇内的差异性尽可能大。

聚类算法小结

 聚类算法评价指标:

  聚错样本数、运行时间、平均准确度(聚类算法小结

聚类算法比较:

  • FCM和K-means都具有较高的准确度,层次聚类准确度最差,SOM耗时较长。
  • K-means 受限于初始点的选取
  • FCM 人为确定聚类数,易陷入局部最优解
  • SOM 处理时间长
  • 层次聚类 一旦被合并就不能修正,聚类质量受限