「Jeremy Jordan」Notes on Machine learning Project Management Guidelines(机器学习项目管理指南)

Sina Weibo:小锋子Shawn
Tencent E-mail:[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/82720316

  我读到一篇不错的博文,介绍机器学习项目管理,来自Jermemy Jordan
  项目生命周期 机器学习项目具有高度迭代性,即在机器学习生命周期中,你在某环节迭代到某个满意的水平,你继续下个任务。通过与现实世界交互,你重新定义下一次迭代开发的目标。如图1所示,为机器学习开发生命周期。
「Jeremy Jordan」Notes on Machine learning Project Management Guidelines(机器学习项目管理指南)
1、计划、项目启动
- 定义任务、琢磨需求
- 决定项目可行性(数据、模型、市场)
- 讨论大致的模型折中(准确率vs速度)
- 建立项目代码库
2、数据收集和标注
- 定义金标准(创建标注文档)
- 建立数据摄取管道(如何收集/爬虫数据)
- 验证数据质量
- 回顾第1步,确保数据是充足的
3、模型调研
- 使用初始数据管道,开始简单模型
- 让简单模型过拟合训练数据
- 决定和执行简单baseline
- 在早期阶段,保持机智,尝试许多并行/独立的想法
- 如果存在世界一流模型,那么寻找到,并复现结果,接着应用你们的数据集,作为第二个baseline
- 回顾第1步,确保可行性
- 回顾第2步,确保数据质量是足够的
4、模型优化