01机器学习

参考

机器学习的基本思路
- 现实问题抽象为数学问题，机器解决数学问题从而解决现实问题
- 通过训练集，不断识别特征，不断建模，最后形成有效的模型，这个过程就叫“机器学习”！
  - 认字的卡片在机器学习中叫——训练集
  - “一条横线，两条横线”这种区分不同汉字的属性叫——特征
  - 不断学习的过程叫——建模
  - 学会了识字后总结出来的规律叫——模型
监督学习、非监督学习、强化学习
- 监督学习是指我们给算法一个数据集，并且给定正确答案。机器通过数据来学习正确答案的计算方法
- 非监督学习中，给定的数据集没有“正确答案”，所有的数据都是一样的。无监督学习的任务是从给定的数据集中，挖掘出潜在的结构。
- 强化学习更接近生物学习的本质，因此有望获得更高的智能。它关注的是智能体如何在环境中采取一系列行为，从而获得最大的累积回报。通过强化学习，一个智能体应该知道在什么状态下应该采取什么行为。
  - 最典型的场景就是打游戏。
机器学习实操的7个步骤
- 收集数据
  - 数据的数量和质量直接决定了预测模型的好坏。
- 数据准备
  - 涉及到数据清洗，没有什么问题后，我们将数据分成3个部分：训练集（60%）用来训练模型、验证集（20%）确保模型没有过拟合、测试集（20%），用于后面的验证和评估工作
- 选择一个模型
- 训练
  - 机器独立就可以完成，整个过程就好像是在做算术题。因为机器学习的本质就是将问题转化为数学问题，然后解答数学题的过程
- 评估
  - 评估的指标主要有准确率、召回率、F值
- 参数调整
  - 完成评估后，改进训练。通过调整参数来做到这一点。当进行训练时，隐含地假设了一些参数，可以通过认为的调整这些参数让模型表现的更出色。
- 预测（开始使用）

01机器学习

相关推荐