20191204——机器学习复习 无监督k-means算法

20191204——机器学习复习 无监督k-means算法

k-means的步骤
1)随机设置k个特征空间内的点作为初始的聚类中心
2)对于其他每个点计算到K个点中心的距离,未知的点选择最近的一个聚类中心点作为标记
3)接着对标记的聚类中心之后,重新计算出每个聚类的中心点(平均值)
4)如果计算得到的新的中心点与原中心点一样,那么结束,否则重新进行第二步过程

k是超参数
1)看需求
2) 网格搜索,调节超参数
API
20191204——机器学习复习 无监督k-means算法
聚类的评估模型
20191204——机器学习复习 无监督k-means算法
20191204——机器学习复习 无监督k-means算法
我们认为这样的聚类是最好
我们用轮廓系数来进行评估

20191204——机器学习复习 无监督k-means算法

20191204——机器学习复习 无监督k-means算法
所有的模型评估都在metrics里

20191204——机器学习复习 无监督k-means算法