Machine Learning Yearning 中文翻译稿

向AI转型的程序员都关注了这个号????????????

大数据挖掘DT机器学习公众号： datayx

目的

根据NG的介绍，本书重点不是 ML 的算法，而是如何使 ML 算法发挥作用。琳琅满目的 ML 算法就像是工具箱里边的各种工具一样，这本书则是教会人们如何使用这些工具。

翻译稿完整版获取：

关注微信公众号 datayx 然后回复 NG 即可获取。

对于书名《Machine Learning Yearning》，我将其翻译为《机器学习要领》，希望能表达出 Andrew NG 编写这本书的目的:

focused not on teaching you ML algorithms, but on how to make ML algorithms work.

Machine Learning Yearning 中文翻译稿

经验即要领，同时单词「yearning」读音和「要领」相似，故以此名之。

在原稿中，Andrew NG 把每一个主题都浓缩到 1-2 页的阅读量，是非常精炼的。而且有些地方是在经过自己的理解之后并尽量遵照原文进行翻译，只是希望尽可能的读起来通顺。

翻译稿

在本书中，你将学习多达 50 多个 Andrew NG 多年总结的工程要领：

绪论「Introduction」

1、为什么需要机器学习策略

2、如何利用本书帮助你的团队

3、预备知识和符号约定

4、规模化驱动下的机器学习发展

配置开发集和训练集「Setting up development and test sets」

随着机器学习正朝着更大的数据集方向发展，关于配置开发/测试集的准则也在发生变化，本章内容将指导你如何在团队中调整机器学习策略，以及如何设置开发集和测试集，以适应现代化的机器学习项目。

5、你的开发集和测试集

6、发集和测试集应当服从同一分布

7、开发集/测试集多大合适

8、为团队进行算法优化建立单一数字评估指标

9、优化和满足指标

10、使用开发集和评估指标加速迭代

11、何时更改开发/训练集和评估指标

12、小结：设置开发和测试集

基本误差分析「Basic Error Analysis」

本章内容将通过描述手动分析误差的流程，来为项目优化选择合适的方向。

13、快速搭建第一个系统并开始迭代

14、误差分析：查看开发集样本来评估想法

15、在误差分析中并行评估多个想法

16、清除标注错误的开发/测试集数据

17、如果你有一个很大的开发集，拆分为两半，并只关注其中一个

18、眼球开发集和黑盒开发集应该多大

19、小结：基本误差分析

偏差和方差「Bias and Variance」

传统的关于偏差和方差的观点在现代机器学习项目中变得越来越不适用，是时候更新这些传统的指导方针了，本章将教你如何利用偏差和方差来优化现代机器学习项目。

20、偏差和方差：两大误差来源

21、举例说明偏差和方差

22、比较最优误差

23、解决方差和偏差

24、权衡偏差和方差

25、减少可避免偏差的技巧

26、在训练集上的误差分析

27、减少方差的技巧

学习曲线「Learning curves」

本章内容将提供一个更加丰富和直观的方式，来帮助你更好地将偏差归因到可避免偏差或者是方差上。

28、诊断偏差和方差：学习曲线

29、绘制训练误差曲线

30、解读学习曲线：高偏差

31、解读学习曲线：其他情况

32、绘制学习曲线

比较人类水平表现「Comparing to human-level performance」

本章内容将提出通过和人类表现水平的比较来加快机器学习发展的策略。学习算法的性能表现在越来越多的领域超越了人类水平表现，从语音识别到图像识别（狭义领域）。在深度学习领域，与人类水平表现竞争已然成为一项新兴的运动，当你的算法表现超越人类的时候会发生什么呢？

33、为什么我们要比较人类表现水平

34、如何定义人类水平表现

35、超越人类表现水平

不同分布下的训练和测试「Training and testing on different distributions」

本章内容将探讨当训练集的数据分布和开发/测试集的分布不一致的时候可能出现的情况。有时候不得不将与测试集不同分布的训练集用在构建模型上，那什么时候这种做法合适呢？如何确保你的算法表现总能在目标分布中表现良好呢？此外，本章同时将教会你如何诊断出数据不匹配，你也将学习如何解决数据不匹配的技术。

36、当你不得不在不同分布中进行训练和测试

37、如何决定是否使用所有数据

38、如何决定是否包含不一致的数据

39、数据加权

40、从训练集到开发集的泛化

41、辨别偏差、方差和数据不匹配导致的误差

42、解决数据不匹配的问题

43、人工合成数据

调试推理算法「Debugging inference algorithms」

本章内容将探讨用于调试语音识别系统、机器翻译系统和增强学习系统的共享 AI 设计模式是什么?

44、优化验证测试

45、优化验证测试的一般形式

46、强化学习的例子

端到端的深度学习「End-to-end deep learning」

Andrew NG 提到他曾经负责开发过一个大型端到端语音识别系统，并取得的很好的效果，但是他同时表示盲目使用该技术并不是好事。本章内容将探讨什么是端到端的深度学习？什么时候应该使用它，什么时候应该避免它？同时给出了当不适合使用端到端学习技术之时，如何将机器学习任务分解成多个子任务的建议

47、端到端学习技术的兴起

48、更多的端到端学习的例子

49、端到端学习的优点和缺点

50、选择管道组件：数据可用性

51、选择管道组件：任务简单性

52、直接学习复杂的输出

根据组件执行误差分析「Error analysis by parts」

本章学习到如何进行机器学习管道的误差分析，如何利用复杂系统的组件来为误差分析提供帮助。

53、根据组件执行误差分析

54、将误差归因到某个组件

55、误差归因的一般情况

56、组件误差分析与人类效率的比较

57、发现有缺陷的机器学习管道

58、全书结语

阅读过本文的人还看了以下：

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加： datayx

Machine Learning Yearning 中文翻译稿

长按图片，识别二维码，点关注

深度学习 500问

归一化含义？

归一化的具体作用是归纳统一样本的统计分布性。归一化在 0-1 之间是统计的概率分布，归一化在-1--+1 之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算，首先基本度量单位要同一，神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的，且 sigmoid 函数的取值是 0 到 1 之间的，网络最后一个节点的输出也是如此，所以经常要对样本的输出归一化处理。归一化是统一在 0-1 之间的统计概率分布，当所有样本的输入信号都为正值时，与第一隐含层神经元相连的权值只能同时增加或减小，从而导致学习速度很慢。另外在数据中常存在奇异样本数据，奇异样本数据存在所引起的网络训练时间增加，并可能引起网络无法收敛。为了避免出现这种情况及后面数据处理的方便，加快网络学习速度，可以对输入信号进行归一化，使得所有样本的输入信号其均值接近于 0 或与其均方差相比很小。

Machine Learning Yearning 中文翻译稿

Machine Learning Yearning 中文翻译稿

目的

翻译稿

绪论 「Introduction」

配置开发集和训练集 「Setting up development and test sets」

基本误差分析 「Basic Error Analysis」

偏差和方差 「Bias and Variance」

学习曲线 「Learning curves」

比较人类水平表现 「Comparing to human-level performance」

不同分布下的训练和测试 「Training and testing on different distributions」

调试推理算法 「Debugging inference algorithms」

端到端的深度学习 「End-to-end deep learning」

根据组件执行误差分析 「Error analysis by parts」

相关推荐

绪论「Introduction」

配置开发集和训练集「Setting up development and test sets」

基本误差分析「Basic Error Analysis」

偏差和方差「Bias and Variance」

学习曲线「Learning curves」

比较人类水平表现「Comparing to human-level performance」

不同分布下的训练和测试「Training and testing on different distributions」

调试推理算法「Debugging inference algorithms」

端到端的深度学习「End-to-end deep learning」

根据组件执行误差分析「Error analysis by parts」