GCN(交通预测)相关论文整理

T-GCN

早期研究

早期的方法只考虑了交通状况在时间上的动态变换,忽略可空间之间的相互依赖。一些研究引入了卷积神经网络来对空间特征进行提取,但普通卷积局限于处理像图像这种欧几里德结构的数据,对于交通数据这种复杂的拓扑结构效果不是很好。

本文贡献

本文引入了最近比较火的gcn,结合GRU来分别提取交通数据的空间特征和时间特征,达到不错的效果。网络也比较简单,亮点主要就是GCN的使用。
GCN(交通预测)相关论文整理GCN(交通预测)相关论文整理
GCN(交通预测)相关论文整理

ST-GCN

本文亮点

  1. 第一次用纯卷积的形式来提取时间特征
  2. 提出了一个新的由时空块组成的神经网络,由于由于这个架构中是纯卷积操作,它比基于RNN的模型的训练速度快10倍以上,而且需要的参数更少。
    注意: 本文图的构建方法并不是基于实际路网,而是通过数学方法构建了一个基于距离关系的网络

网络结构

GCN(交通预测)相关论文整理
如上图,左边为整个网络,中间为ST-Conv Block具体结构,分为时间模块-空间模块-时间模块,来充分提取时空特征,空间模块就是gcn的应用。右边为时间模块的具体结构。

时间模块

  尽管基于RNN的模型可以广泛的应用于时间序列分析,用于交通预测的循环神经网络仍然会遇到费时的迭代,复杂的门控机制,对动态变化的响应慢。相反,CNN训练快,结构简单,而且不依赖于前一步。
  每个顶点的时间卷积的输入可以被看做是一个长度为M的序列,先进行一维卷积,即使用1Kt1*K_tKt1K_t*1大小的卷积核,这里使用2Co2C_o个卷积核,得到的输出为[PQ]R(MKt+1)×(2Co)[P Q] \in \mathbb{R}^{(M-K_t+1) \times (2C_o)}然后接了一个门控线性单元(GLU)作为**,GLU定义为ΓτY=Pσ(Q)R(MKt+1)×Co\Gamma \ast_ \tau Y = P \otimes \sigma (Q) \in \mathbb{R}^{(M-K_t+1) \times C_o}
⊗表示哈达玛积,文中还实现了残差连接,即P改为(P+X),X为时间模块的输入(为了实现残差,X直接取了(MKt+1)(M-K_t+1)这个长度,即X[Kt1:]X[K_t-1:])。

输出层

一个额外的时间卷积和全连接层。