数据分析基础知识点整理第一篇
目录
一、数据分析的类别和作用?
二、数据分析六部曲?
三、基本的分析方法?
四、基础的分析指标和术语
-
平均数
一般指算术平均数,代表总体的一般水平,掩盖总体内各单位的差异,即将全部数据累加除于数据个数,平均数还有几何平均数和调和平均数。
-
绝对数与相对数
绝对数:反映客观现象总体在一定的时间和地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标,如:GDP、总人口等等。此外绝对数也可以直接表现为在一定时间地点条件下数量增减变化的绝对数,比如:A国人口比B国人口多1000万人。
相对数:是由两个有联系的指标对比计算得到的数值,用来反映客观现象之间数量联系程度的综合指标。
相对数公式:相对数=比较数值(比数)/基础数值(基数),分母为用作对比标准的指标数值,简称基数,分子用作与基数对比的指标数值,简称比数。相对数主要以倍数、成熟、百分比等表示,反映客观现象之间数量联系的程度。与总量指标(绝对数)结合使用。
-
百分比与百分点
百分比:一个数是另一个数的百分之几,也称百分率。
百分点:1%=一个百分点,它是用来表示相对指标的变动幅度,变动幅度不宜用百分数而是用百分点。例如:某公司的今年的利润45%,相对于去年的30%,提高了15个百分点。
-
频数与频率
频数:是指一组数据中个别数据重复出现的次数。例:某班学生共50人,按男女性别分组,男学生的频数为30,女学生的频数为20。
频率:每组类别次数与总次数的比值,它代表某类别在总体中出现频繁的程度,一般采用百分数表示,所有组的频率加总为100%。例:某班学生共50人,男学生的频数为30,在全班出现的频率为60%,即(30/50)*100%;女学生的频数为20,女学生在全班出现的频率为40%,即(20/50)*100%。
频数是绝对数,频率是相对数。
-
比例与比率
比列:是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。例:某班学生共50人,男学生30人,女学生20人,则男学生的比例为30:50,女学生的比例为20:50
比率:是指不同类别数值的对比,它反映的不是部分与整体的关系,而是一个整体中各个部分之间的关系。例:某班学生共50人,男学生30人,女学生20人,则男学生和女学生的比率为30:20,这个指标通常被用在社会经济领域。
比例和比率都属于相对数。
-
倍数与番数
倍数:是一个数除以另一个数的商,即A/B=C,A是B的C倍。一般表示数量的增长和或上升幅度,并不适用于表示数量的减少或下降。
番数:是指原来数量的2的N次方倍,例:翻一番为原来数量的2倍(),翻两番为4倍()。
倍数和番数都属于相对数。
-
同比与环比
同比:是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。例如:2017年12月与2018年12月相比。
环比:是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐渐发展的的情况。例如:2018年12月月2018年11月相比。