Challenge2关于数据分析的图形的一些总结



目的:

2.1,找出该公司内部的重要任务并推理其担任的角色与工作职责。

2.2:,按照不同方式对邮件进行分类,进而分析得出有意义的结论。

2.3,根据邮件分析推断该公司的不同发展时期,及其不同发展时期的业务特点。


2.1采用的方法:将元数据过滤之后将邮件按照以下方法分类:

Challenge2关于数据分析的图形的一些总结
缺点:他并没有说明他得到员工通讯录的标准是什么。没有详细的解答过程。

Challenge2关于数据分析的图形的一些总结
Challenge2关于数据分析的图形的一些总结
图的名称:折线图
数据来源:员工邮件的数量,总体邮件的数量
可分析内容:
A.横轴:时间线
B.纵轴:邮件数量
优点:可以十分只管的发现不同员工随时间发展的邮件首发量的变化趋势,这从一定程度上反映了该员工在公司中的发展状况。
缺点:没有说明员工名单的来源,数据来源并不可靠,也不得到一些有价值的线索。
Challenge2关于数据分析的图形的一些总结
图的名称:矩阵图
数据来源:利用多重关联得到的员工的通讯录, 以及员工和其对应的邮箱地址。对整体数据进行分析。得到员工间的邮件通信频度情况,
Challenge2关于数据分析的图形的一些总结
可分析数据:
A.横轴:员工名单
B:纵轴:员工名单
C.小格子的颜色代表通信频度。
优势:通过对邮件阈值的调整可以清楚的看到一些在公司中重要的员工。并且通过将员工作为一个整体来接受邮件。划分员工的组以推测其身份信息。得到如下结果
缺点:没有很好的用可视化图的方式说明如何数据如何得到。
技术实现:CDS

Challenge2关于数据分析的图形的一些总结

2.2,使用范围(内外部),发件方式(群发邮件或者单发邮件),会议通知,告警邮件4种方式划分邮件。
设计了一个查看系统对答案进行展示:

Challenge2关于数据分析的图形的一些总结
Challenge2关于数据分析的图形的一些总结
优势:了解不同员工的邮件成分,可以得到该公司在一段时间内的热词。根据热词或许可以推断出该公司在一段时间内的主要业务。

2.4,划分公司发展阶段以及业务特点。

Challenge2关于数据分析的图形的一些总结
图的名称:折线图
Challenge2关于数据分析的图形的一些总结
数据来源:公司内部参与通信的员工,通信的信件量
可分析数据:
A.横轴:时间轴
B.左边纵轴:是总得通信量
C.右边 纵轴:参与通信的人数。
优势:可以反映出在一段时间内公司通信量和通信人员数量的线性关系,可以得到公司大概的发展阶段
缺点:得到公司发展阶段所选取的标准并不令人信服,并且这张图并不能跟另一个结论相互印证。
Challenge2关于数据分析的图形的一些总结
图的名称:气泡图。
数据来源:邮件的数量,分时段统计邮件中的关键字,主题的讨论频度和普及度。
可分析数据:
A.横轴:时间轴
B.纵轴:主题的普及度
C.颜色:表示该话题的热度颜色越接近红色热度越高。
D.位置:越往上表示话题的普及度越高
Challenge2关于数据分析的图形的一些总结
优势:能够得到几个讨论频率和普及度较为高的话题,可以发现讨论频率和普及度保持着一直的发展趋势。
劣势:并不能得到某一阶段内的业务特点以及业务的更迭变化。也就是说没有分析到业务的持续时间。这样就很难去的到这个公司的发展历程。

总体分析)优点:统计方法用的比较准确,也得到了了一些有价值的结果。而且讨论的频度和普及度不一定相关。

缺点:
1.分析数据所用的标准并不具有很强的说服力。
2.分析图表选用不是很恰当。
3.分析的结果并不能前后相互印证,形成一个逻辑链。也就是说结果很难自证。
改进:
1.先分析数据,结合现实经验得到对数据进行分类的有说服力的标准。
2.在选择统计方式时,尽量多选取几组统计方式来让统计结果相互印证,这样也可以让结果更有说服力。
3.尽量使前后得到的结论能够层层递进,相互印证。以期能形成一个完整的逻辑链。