R语言实战MDS

原理戳这里:

超爱学习:机器学习算法-MDS降维算法​zhuanlan.zhihu.com

1度量MDS

衡量距离用欧式距离,对鸢尾花数据进行降维:

library(stats)
library(ggplot2)
 
iris = iris
dis_iris = dist(iris[,1:4],p = 2)
mds_x = cmdscale(dis_iris)
mds_x = data.frame(mds_x)
xy = cbind(mds_x, iris[,5])
 
ggplot(xy, aes(x=X1,y=X2,colour = iris[, 5]))+geom_point()

R语言实战MDS

图1使用欧式距离对鸢尾花数据进行MDS降维

2度量MDS

衡量距离使用曼哈顿距离,对鸢尾花数据降维

library(stats)
library(ggplot2)
 
iris = iris
dis_iris = dist(iris[,1:4],'manhattan')#曼哈顿距离
mds_x = cmdscale(dis_iris)
mds_x = data.frame(mds_x)
xy = cbind(mds_x, iris[,5])
 
ggplot(xy, aes(x=X1,y=X2, colour = iris[,5]))+geom_point()

 

R语言实战MDS

图2 使用曼哈顿距离对鸢尾花数据进行MDS降维

3美国10个城市的分布

已知美国十个城市之间的直线距离,用MDS推测10个城市的分布

library(stats)
library(ggplot2)
#UScitiesD #美国十个城市直线距离
 
mds_x = cmdscale(UScitiesD,k=2)
plot(x = mds_x[,1], y=mds_x[,2], type='n', xlim = c(-1700, 1500))
cities = attr(UScitiesD, "Labels")
text(-mds_x[,1], -mds_x[,2], cities, cex = .7)

R语言实战MDS

图3 MDS根据城市之间的距离得到城市之间的相对分布

R语言实战MDS

 

图4 美国10个城市实际分布情况