【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction

问题:

具有高时空分辨率的交通事故风险预测困难
- 复杂的交通环境，
- 人类行为
- 缺乏实时的交通相关数据。
交通事故的动态性

本文成果

本文收集了重大交通事故数据，建立了基于循环神经网络的交通事故风险预测深度模型。通过分析交通事故频发的时空模式，提出了交通事故的时空相关性。基于在分析中发现的模式，提出了一种高精度的交通事故风险预测深度学习模型。该模型可以了解交通事故与其时空模式之间的深层联系。作为一种潜在的应用，基于我们方法的交通事故预测系统可用于帮助交通执法部门在交通事故发生前配置警员。

其他论文的缺陷

没有考虑交通事故的周期性模式和空间分布模式,还有其他的影响因素，如天气条件，空气质量等。[ Learning deep representation from big and heterogeneous data for traffic accident inference,2016]

交通事故的形态分析

1.数据集【北京，2016-2017交通事故记录】对于深度学习，数据集会不会太小了？

2.数据处理

离散化， $S_{r,t}$ ，在区域r，时间t时，发生的交通事故数量。

3.空间分布：

观察事故发生的频率与地理位置是否相关。

交通事故发生频率不是均匀分布的，并且与区域的地理位置高度相关。
通常，交通事故最高的区域位于主要的商业和商业区域

【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction
4.时间分布：

为了探索交通事故发生频率的时间模式，我们首先检查了每天的交通事故计数是否在不同时间段有所变化。

显然，交通事故的模式在一天的不同时间段会发生巨大变化。
具体来说，高峰时段的交通事故比非高峰时段更为常见。
时间段是根据中国的工作模式定义的。

【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction

5.周期性分布

观察交通事故频率中是否存在每周的周期性模式。因此，我们绘制了两周的每小时交通事故计数直方图（图4）。
可以观察到，在一周的同一天和工作日之间，直方图的模式相似。

【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction

为了量化交通事故中，时间和空间的相关性，首先定义给定时间t的空间相关性，如下所示：

空间相关性
$C（k,t）= \frac{\sum_{i,j}(a_{i,j,t}-\bar{a_t})(a_{i',j',t}-\bar{a_t})}{\sum_{i,j}(a_{i,j}-\bar{a_t})^2}$
where
$\bar{a_t}=\frac{\sum_{i,j}a_{i,j,t}}{M*N}$
$C（k,t）$ 在给定时间t处与曼哈顿距离k的空间相关性。 $a_{i,j,t}$ 是在网格 $(i,j)$ 和时间t内发生的交通事故数， $\bar{a_t}$ 是所有网格在t是，发生交通事故数量的平均数，M和N是多有网格的经度和纬度。

时空相关性
$f（k,\tau）=\frac{\sum_t(C(k,t)-\bar{C(k))}(C(k,t+\tau)-\bar{C}(k))}{\sum_t(C(k,t)-\bar{C}(k))^2}$
$f（k,\tau)$ 是两个曼哈顿距离为k和时间间隔为 $\tau$ 的网格的相关性。

交通事故时空相关性的等高线图。
可以观察到，该相关性显示出强的时间周期性模式，并且该周期是大约24小时。
如果交通事故的曼哈顿距离在4 km之内，则交通事故的相关性约为0.4 0.5，时间间隔是24小时的倍数。

【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction

模型建立

很难直接预测交通事故是否能直接发生
- 有很多复杂的因素
- 驾驶员分心
- 无法事先收集
t-SNE降维
- 红点（事故）和黑点（非事故）是不可分割的，这意味着很难直接预测交通事故是否发生
- 因此，我们尝试预测交通事故发生频率（风险），即最近几天（3天，7天，30天等）同一时间的每小时平均交通事故计数
流程：
- 将时空大数据离散化
- 构建深度模型
- 输入训练数据，进行训练
- 通过模型，进行预测
- 输出预测的事故风险图
  
  首先，我们将时空大数据离散化，以便可以通过机器学习算法进行处理。
  然后在递归神经网络的基础上构造了一个深度模型来推断交通事故风险，并将处理后的数据输入其中。
  数据训练后，我们将最近的交通事故频率数据输入到训练模型中，然后从输出中获得预测的事故风险图
模型：LSTM

1.我们选择LSTM的原因是LSTM可以捕获交通事故的周期性特征，而传统的RNN在长时间周期训练中表现不佳且存在固有困难。这些缺点已经在与交通流量预测有关的研究中得到了证明[10]。
2.另一方面，LSTM中的显式存储单元可以避免传统RNN中存在的梯度消失或梯度爆炸问题。
3.LSTM的结构类似于传统的RNN，它由一个输入层，一个或几个隐藏层以及一个输出层组成。
4.LSTM的核心概念是其隐藏层中的存储单元，它包含4个主要部分：输入门，具有自循环链接的神经元，忘记门和输出门，其内部结构如图
- 输入层由两部分组成。
  - 第一个输入是最近交通事故发生频率的序列，它被输入到第一个LSTM层。
  - 第二个输入包含我们期望预测的区域中心的经度和纬度.
  - 然后，直接输入完全连接层。
- 深度模型的隐藏层依次由4个LSTM层和3个完全连接的层组成。
- 模型的最后一层是输出层，它输出给定输入的预测交通事故风险（频率）。
- 为了避免过度拟合，我们在每两个完全连接的层之间添加一个具有0：5丢失率的丢失层。
- 全连接层和输出层的**函数为整流线性单位（RELU），在数学上可以表示为max（0; x）。

【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction

实验及结果

实验步骤
- 因为我们的模型与时间相关，所以我们按时间顺序排列数据。
  我们选择2016年1月1日至2017年4月1日的数据作为训练数据，而2017年4月1日至2017年8月20日的数据用于测试。
- 训练数据的最后20％用作验证数据。
  培训，验证和测试的样本量分别为1590958、397740和233850。
- TARPML的体系结构基于Keras（这是一个Python深度学习库）构建。
- 我们选择均方误差作为优化的目标函数，并选择RMSProp作为优化器。
- 通过比较不同输入序列长度的TARPML方法的均方根误差（RMSE）（表I），我们最终选择100作为输入的最佳序列长度。
- LSTM层的神经元数分别为100、200、200、200，每个隐藏层的神经元数为200。
性能评估
- 评估指标：MAE,MSE,RMSE
- 基线模型：Lasso,SVR,DTR,ARMA.TARPML
模型效率：
- （a）是真实的交通事故风险图;（b-e）和不同模型的预测结果
- 清楚地看到TARPML模型远胜于其他模型。
- （f）-（j）是来自不同模型的预测风险曲线及其对应的实际交通风险曲线。
  还可以观察到，来自TARPML模型的预测曲线比其他曲线更准确。

总结

本文工作：提出了基于时空的分析方法，并且基于深度学习模型对其进行预测，发现该模型，由于其他的对比模型。
但是，由于交通事故的复杂性，研究在以下几个方面存在局限性。
- 首先，这里我们仅将交通事故数据本身用于预测。但是，其他相关数据，例如交通流量，人员流动性，道路特征和特殊事件，也可能对交通事故风险预测具有重要意义
- 其次，我们的预测结果是粗粒度的，不能提供道路交通事故风险的预测。但是它可以轻松地应用于基于路网的预测。
  模型对其进行预测，发现该模型，由于其他的对比模型。
但是，由于交通事故的复杂性，研究在以下几个方面存在局限性。
- 首先，这里我们仅将交通事故数据本身用于预测。但是，其他相关数据，例如交通流量，人员流动性，道路特征和特殊事件，也可能对交通事故风险预测具有重要意义
- 其次，我们的预测结果是粗粒度的，不能提供道路交通事故风险的预测。但是它可以轻松地应用于基于路网的预测。
- 因此，未来的工作要结合城市路网的结构和综合与交通事故有关的因素，有望带来更好的预测结果

【论文笔记】A Deep Learning Approach to the Citywide Traffic Accident Risk Prediction