干货 :5种项目助你找到数据科学工作

或许您已经在网上看了许多的MOOC,阅读了很多工具书,但是您有可能仍然担心找不到工作或根本没有找到工作。在数据科学领域找到合适的工作的确有一定难度。最好的向HR展现您能力的方式就是准备一个文件夹。在文件夹中放入以下五种您做过的数据科学项目。


1

数据清洗



通常来讲,数据科学家在一个新的项目中预计会花80%的时间来清洗数据。这对于团队来说是一个长而痛苦的过程。如果您能展示您在清洗数据上具有丰富的经验,您就会变得很有价值。您可以找一些杂乱无章的数据集练习清理数据来增加您的经验。

干货 :5种项目助你找到数据科学工作

如果您用的是Python,Pandas是一个很好用的包;如果您用的是R,dplyr包将会是一个不错的选择。确保您展示出以下的技能:

  • 标注重点数据

  • 连接多个数据集

  • 检测缺失数据

  • 检测异常值

  • 填充缺失数据

  • 确认数据质量


2探索性数据分析



另一项有关数据科学的重要内容是探索性数据分析(EDA)。这是提出问题的过程,需要您用可视化技术来研究这个数据集。EDA使得分析师能够从数据中得出一些能驱动商业决策的结论。或许您能从客户的数据、销售的趋势、季节的影像中得到有趣的结论。甚至有时候您能有一些和您最初设想完全不同的发现。

用于探索性分析的一些有用的Python包是PandasMatplotlib。对于R用户,ggplot2包将很有用。EDA项目应该显示以下技能:干货 :5种项目助你找到数据科学工作

用于探索性分析的一些有用的Python包是PandasMatplotlib。对于R用户,ggplot2包将很有用。EDA项目应该显示以下技能:

  • 能够为调查制定相关问题

  • 识别趋势

  • 识别变量之间的相关关系

  • 使用可视化技术(散点图,直方图,箱线图等)有效地传达结果


3交互式数据可视化


交互式数据可视化包括仪表板等工具。这些工具对数据科学团队以及更多面向业务的最终用户都很有用。仪表板允许数据科学团队进行协作,并一起绘制见解。更重要的是,它们为面向业务的客户提供了一种交互式工具。这些人专注于战略目标而非技术细节。通常,数据科学项目的可交付成果将以仪表板的形式出现。

干货 :5种项目助你找到数据科学工作

对于Python用户,BokehPlotly库非常适合创建仪表板。对于R用户,请务必查看RStudio的Shiny软件包。您的仪表板项目应突出显示以下重要技能:

  • 包括与客户需求相关的指标

  • 创建有用的功能

  • 逻辑布局(“F模式”便于扫描)

  • 创建最佳刷新率

  • 生成报告或其他自动操作




4机器学习


机器学习项目是数据科学组合的另一个重要部分。在您开始构建一些深度学习项目之前,请退后一步。我们说的并不是建立复杂的机器学习模型,而是坚持基础。线性回归和逻辑回归是很好的开始。这些模型更易于解释和与上层管理层沟通。我还建议关注一个对业务有影响的项目,例如预测客户流失,欺诈检测或贷款违约。这比预测花型更贴近于工作实际。

干货 :5种项目助你找到数据科学工作

如果您是Python用户,请使用Scikit-learn库。对于R用户,请使用Caret包。您的机器学习项目应该传达以下技能:

  • 您选择使用特定机器学习模型的原因

  • 将数据拆分为训练/测试集(k倍交叉验证)以避免过拟合

  • 选择正确的评估指标(AUC,adj-R ^ 2,混淆矩阵等)

  • 特征值的选择

  • 超参数调整


5沟通能力


沟通是数据科学的一个重要方面。能否有效地传达结果是优秀数据科学家与优秀科学家之间的区别。无论您的模型多么花哨,如果您无法向队友或客户解释,您将无法获得他们的支持。幻灯片和笔记本电脑都是很好的沟通工具。尝试将您的一个机器学习项目放入幻灯片格式中。您还可以将Jupyter NotebookRMarkdown文件用于需要沟通的项目。

干货 :5种项目助你找到数据科学工作

确保了解您的目标受众是谁。向高管们展示您的项目和向机器学习专家展示是非常不同的。一定要掌握这些技能:

  • 了解您的目标受众

  • 使用相关的可视化技术

  • 请勿过多地提供幻灯片

  • 确保您的演示文稿流畅

  • 将结果与业务影响相结合(降低成本,增加收入)


确保在Jupyter笔记本或RMarkdown文件中记录您的项目。然后,您可以使用Github Pages将这些文件免费转换为静态网站。这是向潜在雇主展示您的项目的好方法。


干货 :5种项目助你找到数据科学工作


原文URL:https://www.kdnuggets.com/2018/06/5-data-science-projects-hired.html

原文作者:John  Sullivan

原文题名:5  Data  Science  Projects  That  Will  Get  You  Hired  in   2018

翻译、校对、排版:李昊璟、朝乐门

END

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。


关联阅读:

原创系列文章:

1:从0开始搭建自己的数据运营指标体系(概括篇)

2 :从0开始搭建自己的数据运营指标体系(定位篇)

3 :从0开始搭建自己的数据运营体系(业务理解篇)

4 :数据指标的构建流程与逻辑

5 :系列 :从数据指标到数据运营指标体系

6:   实战 :为自己的公号搭建一个数据运营指标体系

7:  从0开始搭建自己的数据运营指标体系(运营活动分析)

数据运营 关联文章阅读:  

运营入门,从0到1搭建数据分析知识体系    

推荐 :数据分析师与运营协作的9个好习惯

干货 :手把手教你搭建数据化用户运营体系

推荐 :最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始,构建数据化运营体系

干货 :解读产品、运营和数据三个基友关系

干货 :从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读:

干货 :数据分析团队的搭建和思考

关于用户画像那些事,看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系,看这一文章就够了

干货 : 聚焦于用户行为分析的数据产品

如何构建大数据层级体系,看这一文章就够了

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

从底层到应用,那些数据人的必备技能

读懂用户运营体系:用户分层和分群

做运营必须掌握的数据分析思维,你还敢说不会做数据

合作请加qq:365242293  


更多相关知识请回复:“ 月光宝盒 ”;

数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

干货 :5种项目助你找到数据科学工作