Andrew Ng机器学习笔记week6 机器学习的应用与设计
机器学习应用中的建议
1、如何debug一个学习算法
2、如何评估一个假设h(x)
3、模型的选择、训练集、检验集、测试集
将数据集合分为三部分,训练集占60%,检验集(Class Validation)占20%,最后测试集占20%
4、bias VS variance
5、正则化和偏差(bias)、方差(variance)
6、神经网络的过拟合
7、学习曲线
机器学习系统设计
垃圾分类系统举例
1、特征向量←某些问题是否在邮件中出现 选取特征x
①收集样本
②基于邮件的路由信息推出一些复杂特征
③基于邮件的正文信息推出一些复杂特征
④用一些复杂算法来检测拼写错误
2、误差分析
其中,stemmer–词干分析器
3、Error metrics for skewed classes 类偏斜的误差矩阵
查准率和查全率
4、P、R、F1score
5、数据