大数据统计学直观图表(二)

3. 统计学直观图表

原数据太杂乱无章,难以看出规律性;只依赖数字来描述集中趋势与离散程度,让人难以对数据产生直观的印象,这时就需要用到图表。

3.1 直方图

频数分布表

大数据统计学直观图表(二)

频数直方图

大数据统计学直观图表(二)

频率直方图

大数据统计学直观图表(二)

3.2 箱线图

大数据统计学直观图表(二)

上边缘:除异常点以外的数据中的最大值

上四分位数:将所有数据按照从小到大的顺序排序排在第75%位置的数字

下四分位数:将所有数据按照从小到大的顺序排序排在第25%位置的数字

下边缘:除异常点以外的数据中的最小值

3.3 茎叶图

大数据统计学直观图表(二)

将数据分为茎和叶两部分,这里的茎是指十位上的数字,叶是指个位上的数字。将茎部分(十位)从小到大,从上到下写出来。相对于各自的茎,将同一茎(十位)的叶子(个位)从小到大,从左往右写出来。

3.4 线图

大数据统计学直观图表(二)

3.5 柱形图

柱形图:显示一段时间内的数据变化或显示各项之间的比较情况。

大数据统计学直观图表(二)

3.6 饼状图

饼状图,根据各项所占百分比决定在饼图中的扇形面积。简单易懂,通俗明了,可以更加形象地看出各个项目所占的比例大小。

大数据统计学直观图表(二)