深度学习 基本介绍+数据集及其拆分

机器学习 (Machine Learning)

定义:

是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数。并最终对数据进行预测和分析的一门学科。

  • 二分类问题的基本解决思路:
    深度学习 基本介绍+数据集及其拆分
    (1)建立假设模型(可理解为函数)。即建立一条直线,表达式为y=f(x)=W1x + W0。
    则通过确定模型参数W1与W0的取值,就可以确定函数的具体位置。
    (2)训练模型。利用已明确分类结果的样本数据集(称为训练集)进行训练,即函数参数的求解过程。得到参数W1与W0的最终取值,则得到最终的训练模型。
    (3)进行分类判别。利用训练好的模型对待分类的数据进行分类判别,得出其属于哪一类。

  • 多类分类问题可分为二类分类问题进行解决。除了直线也可用曲线进行分类,效果更好。在高维空间中可用曲面进行分类,但过程类似。


深度学习(Deep Learning)

定义:

一种实现机器学习的技术,是机器学习的重要分支。
源于人工神经网络的研究,深度学习的模型结构是一种含多隐藏层的神经网络。
通过组合低层特征形成更加抽象的高层特征。
深度学习 基本介绍+数据集及其拆分
通过一个例子了解机器学习中,简单线性分类器与深度学习的区别:
深度学习 基本介绍+数据集及其拆分
简单分类器是通过加权计算的方式,w1,w2,w3,w4为各分量x的权重。
通过线性模型y=f(w1x1+w2x2+w3x3+w4x4),若括号里的结果大于等于阈值,则输出1,反之则输出0。
深度学习 基本介绍+数据集及其拆分同样的问题如果用深度学习方法,通常是在线性模型中间加入中间层。其中参数U表示从输入层结点到中间层结点之间连线的权重。
公式与线性分类器相似,但是这样的特点是经过中间层,可有效的组合底层特征形成高层特征,减少了特征值数量。
深度学习中往往包含多个中间层(隐藏层),且网络结构更复杂一些。


机器学习VS深度学习

深度学习 基本介绍+数据集及其拆分机器学习需要人工选取特征
深度学习会自动学习有用特征