(6) 使用卷积神经网络做交通速度预测
交通预见未来(6) 使用卷积神经网络做交通速度预测
1、文章信息
《Learning Traffic as Images: A Deep Convolutional Neural Network for Large-Scale Transportation Network Speed Prediction》。
北航马晓磊老师2017年发在开源期刊Sensor上的一篇文章(大类工程技术3区,IF:2.475),被引168次。
2、摘要
本文提出了一种基于卷积神经网络(CNN)的交通速度预测方法,该方法将交通网络作为图像进行学习,并对大规模、全网范围内的交通速度进行预测。利用二维时空矩阵将时空交通状态转化为描述交通流时空关系的图像。文章主体分为两步:利用CNN提取交通特征和网络范围的交通速度预测。以北京二环路和北京东北地区交通网络为例进行研究,并将该方法与常用的四种算法(普通最小二乘OLS、k近邻KNN、人工神经网络ANN和随机森林RW)和三种深度学习结构(堆叠式自动编码器SAE、递归神经网络RNN和长短时记忆网络LSTM)进行比较。结果表明,在可接受的执行时间内,该方法的平均精度比其他算法提高了42.91%。CNN可以在合理的时间内对模型进行训练,适用于大型交通网络。
3、简介和文献综述
意义+目前面临的挑战+目前使用方法分类+每一类别的综述+既有研究不足+自己做的内容+罗列本文贡献。
4、理论部分
本文使用的是出租车轨迹数据,利用轨迹数据获取某个路段某个时间段(本文2分钟)的平均交通速度,并整理成如下M矩阵形式。
N为时间间隔的长度,Q为路段的长度,像素mij是第i路段在j时刻的平均交通速度。设x轴和y轴分别表示矩阵的时间和空间。生成的矩阵可以看作是图像的一个通道channel,因此,图像的宽度为M像素,高度为N像素。
交通矩阵提取示意图如下:
CNN用作图片识别和交通预测的区别:
首先,模型输入是不同的,即,输入图像只有一个通道值,该通道值由交通网络中所有道路的交通速度决定,图像像素值范围为0到网络的最大交通速度或速度上限。而在图像分类问题中,输入图像一般有三个通道,即RGB和像素值的范围从0到255。虽然存在差异,为了防止模型权重增加模型训练难度,要对模型输入进行了规范化。
其次,模型输出是不同的。在交通环境下,模型输出是预测交通网络各路段的交通速度,而在图像分类问题中,模型输出是图像类标签。
第三,抽象特征有不同的含义。在交通背景下,卷积层和池化层提取的抽象特征是路段之间关于交通速度的关系。在图像分类问题中,根据训练目标,抽象特征可以是图像的浅层边缘和某些对象的深层形状。
第四,目标函数因模型输出的不同而不同。在交通方面,由于输出是连续的交通速度,因此应该采用连续的目标函数(MSE)。在图像分类问题中,通常使用交叉熵代价函数cross entropy。
文章的网络架构如下:
5、案例研究将在下篇文章中叙述
6、Writing Tips from This Paper
(1)Recently, a wealth of literature leverage multiple hybrid models and spatiotemporal features to improve traffic prediction performance.(leverage:利用)
(2)In summary, statistical methods have been widely used in traffic prediction, and promising results have been demonstrated. However, these models ignore the important spatiotemporal feature of transportation networks, and cannot be applied to predict overall traffic in a large-scale network. (In summary, … However, …总结+转折引出自己的创新点)
(3)Spatiotemporal features of network traffic can be extracted using a CNN in an automatic manner with a high prediction accuracy. (in an automatic manner 自动的)
关注微信公众号《当交通遇上机器学习》,后台回复“数据”即可获取高达175G的四个月的滴滴GPS数据和滴滴订单数据的获取方式,以及从数据处理(Oracle数据库)、模型构建(机器学习)、编程实现(python)到可视化(ArcGIS)等一系列****。
公众号以交通大数据为主线,专注于人工智能、机器学习、深度学习在道路交通和轨道交通领域内的科研前沿与应用,在交通大数据与机器学习的道路上越走越远!