【数学建模】聚类模型 - K-means & 系统(层次)算法
聚类和分类的区别
聚类是不知道类别,自己分类
分类是已知类别的
聚类模型
K-means聚类
数据对象即样本
聚类中心即重心
PS:和我们初始化选择的中心有很大关系
如何写在论文里
因为算法步骤太长了,而且易被查重
因为算法太长了,放流程图:
优缺点:
改进 K-means++算法
K值这么定,量纲不一样怎么办?
不需要指定K的算法:系统(层次)算法
样本和样本直接的距离如何计算
样本和样本之间的距离
绝对值距离和欧式距离最常用
绝对值距离更多的用于网状数据
指标和指标之间的距离(不常用、用于指标分类)
类与类之间的距离
因为样本和样本被划分为不同的类,就被划分到不同的类了
组间、组内用的多