深入浅出统计学-第一章

何伟统计学?
通过某种有意义的方式,对原始事实和数字进行提炼,仅仅观察原始数据是无法得出有效信息的。

对统计的研究包含了: 统计数据的来源,计算方法及有效方法并得出结论。

信息和数据的区别?
数据是单纯的数字,本身没有任何含义;比如5,6,7,如果告诉你这是孩子的年龄,那这些数字就有意义了。这就叫信息。

干嘛要用图形表示?
推挤如山的数字很难看出一些模式和趋势,通过图形直观的体现。

图表的绘制

饼状图:
饼状图中的每个扇形代表了每组数据的相对频数或者所占整数的比例。在对基本笔记进行比较的时候,饼状图有用。通过与其他组进行比较,很容易看出哪个数据具有较高的频数。
饼状图体现比例。
深入浅出统计学-第一章

条形图:
如果各个数据比例相似,饼状图作用不大,因为很难区别出来差异。
所以需要使用条形图。条形图能对相对大小比较,另一个优点是更精确
条形图可以是水平, 也可以是垂直。
深入浅出统计学-第一章
深入浅出统计学-第一章

在使用条形图的时候,可以体现频数,也可以体现百分数,但是什么情况下体现百分数,什么情况下体现频数? 根据需要体现,或者同时在图中标出二者。 比如堆积条形图,分段条形图。

在使用图形的时候需要弄清楚所处理的是哪一类数据,才能决定使用哪一种图标能更好的展现数据。

类别数据(定性数据):数据被划分为某一种类别,描述某一类性质或者特征。比如上面的途中的游戏分类,就是定性数据。
定性数据重要的一点是: 不能把数据值理解为数字。脱离含义的数字是无意义的。

数值型数据(定量数据):即数值是有数字意义的,但是还涉及计量和计数。
比如下面这个:
深入浅出统计学-第一章

对于上面的表格数据,可以使用直方图展现。

直方图和条形图相似,但是重大区别是:
(1)直方图的每个长方形面积表示频数(即总数);
(2)图中的长方形之间没有间隔;
深入浅出统计学-第一章
注意:
(1)直方图中的X轴区间数值是可以调整的,
(2)各个区间宽度可以不同;

举例子,对下面的表格的数据做出直方图:
深入浅出统计学-第一章

因为一个区间的小时数是不同的,不能直接使用表中的小时列作为区间;
所以,需要求出每个区间中的小时数,再用频数除以小时数,即得出该区间内的评价每小时的频数。
即下表:
深入浅出统计学-第一章
深入浅出统计学-第一章
上图中的表示1000天这句是书上的错误。
从频数直方图看出, 横轴表示的是每小时的平均频数。

直方图是专门体现分组数据的图形。看起来很像条形图,但是又差别。
直方图的每个长方形高度是频数密度(即频数除以区间单位)。
条形图的竖轴频数。

深入浅出统计学-第一章