tableau篇之泰坦尼克号年龄分布表格化分析

  • 分析目的:分析泰坦尼克号数据中不同舱位、不同性别的平均年龄分布,以表格的形式展示出来。

  • 分析结果展示:
    *

    tableau篇之泰坦尼克号年龄分布表格化分析

  • 分析结论:头等舱平均年龄最高,二等舱次之,三等舱平均年龄最少。在所有舱位中男性的平均年龄均比女性的高。

  • 1.使用tableau打开数据集:

tableau篇之泰坦尼克号年龄分布表格化分析
其中各字段含义为:
   PassengerId ,乘客的id号,这个我觉得对生存率没影响。因为一个人的id号不会影响我是否生存下来吧。这列可以忽略
   Survived ,生存的标号,上面图的数值1表示这个人很幸运,生存了下来。数值0,则表示遗憾。
   Pclass ,船舱等级,就是我们坐船有等级之分,像高铁,飞机都有。这个属性会对生产率有影响。因为一般有钱人,权贵才会住头等舱的。保留。
   Name ,名字,这个不影响生存率。我觉得可以不用这列数据。可以忽略
   Sex , 性别,这个因为全球都说lady first,女士优先,所有这列保留。
   Age , 年龄,因为优先保护老幼,这个保留。
   SibSp ,兄弟姐妹,就是有些人和兄弟姐妹一起上船的。这个会有影响,因为有可能因为救他们而导致自己没有上救生船船。保留这列
   Parch , 父母和小孩。就是有些人会带着父母小孩上船的。这个也可能因为要救父母小孩耽误上救生船。保留
   Ticket , 票的编号。这个没有影响吧。
   Fare , 费用。这个和Pclass有相同的道理,有钱人和权贵比较有势力和影响力。这列保留
   Cabin ,舱号。住的舱号没有影响。忽略。
   Embarked ,上船的地方。这列可能有影响。我认为登陆地点不同,可能显示人的地位之类的不一样。我们先保留这列。

  •    2.把class从度量变为维度:直接把pclass从度量拖动到维度

                                                         tableau篇之泰坦尼克号年龄分布表格化分析

   3.以pclass拖动到行,并把age拖动到文本标记中,这样显示的就是不同舱位的年龄总和。

            tableau篇之泰坦尼克号年龄分布表格化分析
   4.但是这并不是我们想要的结果,接下来我们把Age从总和设置为平均值,当然可以根据需求设置为其他的取值。
*

tableau篇之泰坦尼克号年龄分布表格化分析

   5.制作完成之后就会出现下面的结果。
*

tableau篇之泰坦尼克号年龄分布表格化分析

   6.但是这样看的时候pclass和1,2,3并不友好,我们可以为他们起一个别名使图标更加友好。
*

tableau篇之泰坦尼克号年龄分布表格化分析
*
tableau篇之泰坦尼克号年龄分布表格化分析

   7.修改之后如下图这样的效果会更加友好一些。
*

tableau篇之泰坦尼克号年龄分布表格化分析

   8.如果我们想看一下不同舱位,不同年龄的平均分布又该如何呢。我们只需要把sex拖动到列中即可。这样我们就可以看出来不同舱位,不同性别的平均年龄分布。

*

tableau篇之泰坦尼克号年龄分布表格化分析

   9.当然我们也可以按下面操作交换行列值,变换另一种显示格式,使表格更加清晰。

*

tableau篇之泰坦尼克号年龄分布表格化分析

   9.最终扩展,在页面的最右侧含有智能显示功能,该功能智能提供了,所编辑数据可以使用的图表,前三个为表的不同显示,可以使表更加美观。
*

tableau篇之泰坦尼克号年龄分布表格化分析

*

tableau篇之泰坦尼克号年龄分布表格化分析

注: 数据集链接:链接: https://pan.baidu.com/s/1O44gbPa7lTa5Tfr4_Btetw 密码: hu46