人工智能入门-R语言数据分析与数据挖35

分位数

ß第p百分位数

Þ使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值

Þ

ß如何计算?

Þ将原数据从小到大排列

Þ计算i=(p/100)*n

人工智能入门-R语言数据分析与数据挖35
 

Þ若i是整数, 则第p百分位数为第i项与第 i+1 项的平均

Þ若i不是整数,则向上取整。

 

总结五数

ß最小值、第一个四分位数、中位数、第三个四分位数、最大值。

 

ß从这五个值可以大致看出数据分布的中心和离散程度。

 

ß箱图则是这五个数的图形表现 

 

用箱图表达“总结五数”

人工智能入门-R语言数据分析与数据挖35

人工智能入门-R语言数据分析与数据挖35