batchsize的初步理解

谈到batchsize,必须引出多个样本的向量化问题
batchsize的初步理解
对于上图一个神经网络,假设有m条数据,如果采用非向量化的输入,就是一条一条的输入,伪代码如下:
batchsize的初步理解
其中z[1] (i)中的一表示神经网络第一层,i表示第i条样本数据。
向量化的输入数据X就是这种形式,m列表示m条样本。其实所谓的神经网络的连接,就是矩阵的乘法,这种计算方法在计算机中要比非向量化的每次输入单条数据的要快的多。
batchsize的初步理解
而batchsize就是考虑到有时候数据量可能很大,不能全部将数据送入到内存中,每次选n条样本送入内存,这个n就是batchsize。