吴恩达老师机器学习笔记K-means聚类算法(一)
今天接着学习聚类算法
以后坚决要八点之前起床学习!不要浪费每一个早晨。
K-means聚类算法聚类过程如下:
原理基本就是先从样本中随机选择聚类中心,计算样本到聚类中心的距离,选择样本最近的中心作为该样本的类别。最后某一类样本的坐标平均值作为新聚类中心的坐标,如此往复。
原始数据如下:
代码如下:
load('ex7data2');
[m n]=size(X);
x=zeros(m,n+1);
x(1:m,1:n)=X;
Z_min=9999999;
y=zeros(m,1); % 最优类别结果
for iter=1:100 % 选择最优的聚类的结果
start=round(rand(3,1)*(m-1)+1); % 随机化聚类中心
start_centre=X(start,:);
Z_sum=0;
for j=1:200 % 判断样本距离最近的中心
for i=1:m
Z=sum((x(i,1:n)-start_centre(:,1:n)).^2,2);
[min_value,min_index]=min(Z);
x(i,n+1)=min_index;
end
for i=1:3 % 聚类数量选择3类
start_centre(i,:)=mean(X(x(:,n+1)==i,:)); % 生成新的聚类中心
end
end
for i=1:m % 计算成本函数
Z_sum=sum((x(i,1:n)-start_centre(x(i,n+1),1:n)).^2,2)+Z_sum;
end
if Z_min>Z_sum % 选取成本最小的结果作为最优结果
Z_min=Z_sum;
y=x(:,3);
end
end
scatter(X(:,1),X(:,2),8,y,'filled');
最后聚类结果如下:
这次代码非常的简单了。。。。