异常检测的统计学方法

通常可以使用两种指标:Z分数四分位距(IQR)

计算一个样本的 z 分数,就是减去均值再除以标准差,如果绝对值大于三倍标准差,就认为这个样本异常,属于离群点。

对于正态分布的数据,用 Z 分数为指标,有千分之三的离群点。
异常检测的统计学方法
用 IQR 为指标,判定的方式为:在四分位点上加上1.5倍IQR,这个范围之外的都是离群点,正态分布有千分之七的离群点。
异常检测的统计学方法
IQR 常用来画箱线图,所以箱线图也可以用来直观展示数据的离群点。