01机器学习
- 机器学习的基本思路
- 现实问题抽象为数学问题,机器解决数学问题从而解决现实问题
- 通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”!
- 认字的卡片在机器学习中叫——训练集
- “一条横线,两条横线”这种区分不同汉字的属性叫——特征
- 不断学习的过程叫——建模
- 学会了识字后总结出来的规律叫——模型
- 监督学习、非监督学习、强化学习
- 监督学习是指我们给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法
- 非监督学习中,给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。
- 强化学习更接近生物学习的本质,因此有望获得更高的智能。它关注的是智能体如何在环境中采取一系列行为,从而获得最大的累积回报。通过强化学习,一个智能体应该知道在什么状态下应该采取什么行为。
- 最典型的场景就是打游戏。
- 机器学习实操的7个步骤
- 收集数据
- 数据的数量和质量直接决定了预测模型的好坏。
- 数据准备
- 涉及到数据清洗,没有什么问题后,我们将数据分成3个部分:训练集(60%)用来训练模型、验证集(20%)确保模型没有过拟合、测试集(20%),用于后面的验证和评估工作
- 选择一个模型
- 训练
- 机器独立就可以完成,整个过程就好像是在做算术题。因为机器学习的本质就是将问题转化为数学问题,然后解答数学题的过程
- 评估
- 评估的指标主要有 准确率、召回率、F值
- 参数调整
- 完成评估后,改进训练。通过调整参数来做到这一点。当进行训练时,隐含地假设了一些参数,可以通过认为的调整这些参数让模型表现的更出色。
- 预测(开始使用)
- 收集数据