深度学习之美——深度学习基本介绍

转载请注明出处 https://blog.****.net/nk1212582/article/details/81429482

一入侯门“深”似海,深度学习深几许

深度学习的巨大影响

将人类过去痴迷的算法问题,演变成数据和计算的问题

“算法为核心竞争力”正转变为“数据为核心竞争力”

深度学习的所有特征的提取,全程不虚人工提取,这个自主特性在机器学习领域是革命性的

机器学习的4个象限

深度学习之美——深度学习基本介绍

可统计是指,对于同类事物,它具有一定个规律性,这是一切统计学习的基本假设

不可推理,是指“剪不断、理还乱”的非线性状态

传统机器学习(位于第II象限),通常是用人类的先验知识,把原始数据预处理成各种特征,然后根据特征进行分类。这种分类的效果,高度取决于特征选取的好坏。因此,传统机器学习又称特征工程。

深度学习在本质上属于可统计不可推理的范畴。

什么是深度学习

为了让神经网络的学习性能表现得更好,人们只能依据经验,不断尝试性地进行大量重复的网络参数的调整

深度学习是一种包含多个隐含层的多层感知机,通过组合底层特征,形成更为抽象的高层表示,用以描述被识别对象的高级属性类别或特征。能自生成数据的中间表示(虽然这个表示并不能被人类所理解)。

深度学习的方法论

深度学习是“end-to-end”(端到端),输入的是原始数据(始端),然后输出的直接就是最终目标(末端),中间过程不可知

深度学习是一个黑箱系统,缺乏解释性

在认知上,有了从一个状态或系统直接整体变迁到另外一个状态或系统的形态,这就是深度学习背后的方法论。

大数据时代为我们认识复杂世界提供了珍贵的资源——多样而全面的数据。

“全部数据”和复杂性科学中的“整体性”,在一定程度上是有逻辑对应关系的。

大数据是问题,而深度学习就是其中的一种解决方案。

 

人工“碳”索意犹尽,智能“硅”来未可知

人工智能的“江湖定位”

人工智能,简单来讲,大致就是用“硅基大脑”模拟或重现“碳基大脑”

深度学习的归属

深度学习是高度数据依赖型的算法,性能通常是随着数据量的增加而不断增强的。

机器学习都存在两个层面的分析:

(1)面向过去(对收集到的历史数据进行训练),发现潜藏在数据之下的模式,称之为描述性分析,主要使用了“归纳”方法

(2)面向未来,基于已构建的模型,对新输入的数据对象进行预测,称之为预测性分析,侧重于“演绎”

机器学习的形式化定义

学习的核心就是改善性能

机器学习要想做得好,需要走好三大步:

(1)建模问题:如何找一系列的函数实现预期的功能

(2)评估问题:如何找出一系列评价标准来评估函数的好坏

(3)优化问题:如何快速找到性能最佳的函数

为什么要用神经网络

连接主义:试图编写一个通用模型,然后通过数据训练,不断改善模型中的参数,知道输出的结果符合预期。

连接主义认为,人的思维就是某些神经单元的组合。因此,可以在网络层次上模拟人的认知功能,用人脑的并行处理模式,来表征认知过程。

人工神经网络的特点

人工神经网络是一种非线性、自适应的信息处理系统。该系统由大量彼此相连但功能简单的处理单元构成。

人工神经网络具有四“非”特性:

(1)非线性:**函数是非线性的

(2)非局限性:任何一个神经元的“作用域”都不是局部的,而是可能通过网络连接波及全网

(3)非常定性:人工神经网络一直处于“更新”状态,具有强大的自适应、自组织、自学习能力

(4)非凸性:当前的神经网络,通常采用诸如Sigmoid、Tanh、ReLU等非线性**函数,这就导致神经网络的目标函数具有非凸性

通用近似定理

一个包含足够多隐藏层神经元的多层前馈网络,能以任意精度逼近任意预定的连续函数