全连接神经网络

单个神经元
感知机
全连接神经网络

单个神经元

人们根据生物神经元(Neuron)的结构抽象出了神经元的的数学模型。
全连接神经网络
　　神经元输入向量 $\bm{x}=[x_1,x_2,...,x_n]^T$ ，经过函数映射： $f_\theta: x →y$ 后得到输出 $y$ ，其中 $\theta$ 为函数 $f$ 自身的参数。
　　考虑一种简化的情况，即线性变换： $f(x)=\bm{w^Tx} + b$ ，展开为标量形式:
$f(\bm{x})=w_1x_1+w_2x_2+...+w_nx_n + b$ 参数 $\theta= \{w_1,w_2,...,w_n,b\}$ 确定了神经元的状态。这就是神经元线性模型(单神经元模型)。

感知机

1943 年，美国神经科学家 Warren Sturgis McCulloch 和数理逻辑学家 Walter Pitts 从生物神经元的结构上得到启发，提出了人工神经元的数学模型，这进一步被美国神经物理学家 Frank Rosenblatt 发展并提出了感知机(Perceptron)模型。
全连接神经网络
感知机接受长度为n的一维向量 $\boldsymbol{x}=[x_1,x_2,...,x_n]^T$ ，每个输入节点通过权值为 $w_i$ , ????????[1,n]的连接汇集为变量 $z$ ，即：
$z=w_1x_1+w_2x_2+...+w_nx_n + b$
其中 ???? 称为感知机的偏置(Bias)，一维向量 $\boldsymbol{w} = [w_1,w_2,...,w_n]^T$ 称为感知机的权值(Weight)， $z$ 称为感知机的净活性值(Net Activation)。感知机是线性模型，并不能处理线性不可分问题。通过在线性模型后添加**函数后得到活性值(Activation) $a$ :
$a = \sigma(z) = \sigma(\boldsymbol{w^Tx} + b)$
　　其中**函数可以是阶跃函数(Step function),也可以是符号函数(Sign function)。添加**函数后，感知机可以用来完成二分类任务。但是，阶跃函数和符号函数在 $z$ = 0处是不连续的，其他位置导数为 0，所以无法利用梯度下降算法进行参数优化。
　　阶跃函数：
　　全连接神经网络
　　符号函数：
　　
　　以感知机为代表的线性模型不能解决异或(XOR)等线性不可分问题，这直接导致了当时新兴的神经网络的研究进入了低谷期。