箱线图原理及如何选择分位数

学习箱线图的时候,总感觉学的不顺手,先了解箱线图原理有很大的帮助。

本篇适用于初学者

箱线图原理及如何选择分位数

举一例:

(数据是编的)

某大学22位学生离校时间(天):

1  2  2  2  3  3  3  4  4  5  5  

5  6  6  7  7  8  9  9  9  10  19  


Min: 1

Max: 19

M: (5+5)/2 = 5

22 * 0.25 = 5.5 得 Q1 = 3  (第 6 个数)

22 * 0.75 = 19.5 得 Q3 = 9 (第 20 个数)

所以 IQR = Q3 - Q1 = 6

Q1 - 1.5IQR = 3 - 9 = -6,Q3 +1.5IQR = 9 + 9=18

所以数据在0-18天内的不是异常值,之外的是疑似异常值

19是异常值

箱线图原理及如何选择分位数

对于选择分位数,数据量n乘以第p分位

np是小数,选择位置加1 的数据Q (int(np)+1)

整数的话,1/2(  Qnp + Q(np+1)  )