【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5


气溶胶光学厚度AOD数据(aerosol optical depth)和地面观测站数据构成了对PM2.5的可靠量测,一般的 AOD-PM2.5关系都是使用线性模型进行模拟的。使用深度学习的方法可以模拟非线性关系,但是没有考虑空间因素。本实验使用中国地区的satellite AOD products、NDVI data 、meteorological factors 和station PM2.5 measurements 作为输入数据,得到非地面观测站区域的数据(也许从某种意义上说算是一种插值方法),并在此基础上得到分辨率为0.1°的PM2.5 区域数据



 global modeling和spatio-temporal modeling是两种对PM2.5的描述方法。global modeling(LR, MLR, SEM, machine learning models)不随时间和地点变化,在所有研究区域都使用相同的系数;spatiotemporal modeling使用随时间和空间变化的系数,考虑到了AOD-PM2.5之间关系的时空动态性。本文的目标是在机器学习中综合时空异质性建立时空动态的AOD-PM2.5非线性模型

也就是建立geographically and temporally weighted neural networks (GTWNNs)


 Study region and data


卫星数据:MODIS C6 Terra 和 Aqua AOD的 AOD_550_Dark_Target_Deep_Blue_Combined_Mean_Mean产品,10km分辨率(AOD产品详情),两种AOD产品直接取值或者求平均。此外NDVI用以反映土地利用情况

气象数据:NASA的重分析数据MERRA-2,空间分辨率为0.625° longitude × 0.5° latitude,变量包括 wind speed、air temperature、relative humidity、surface pressure 以及 planetary boundary layer height


1、统一投影到同一个坐标系  2、线性方法重采样到 0.1 degree  3、提取地面站点所在位置的卫星和气象数据


 GTWGRNN model


其中【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5代表在格网 j 的PM2.5预测值,即位置【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5以及年天数 j 。为以地面PM2.5作为输入的时空函数,使用的是generalized regression neural network (GRNN)模型

【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5


1、输入层:satellite AOD, RH, WS, TMP, PS, PBL 以及NDVI等


3、汇总层:only one node



① 使用第 T 天以及之前天数的数据

② 使用 Gaussian distance decay-based weighting function 来衡量在时空维度 k 样本对 prediction grid cell j 的重要性,即

【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5

 ds 和 dt 是 k 对 prediction grid cell j 的时空距离;

λ 平衡时空作用;λ = 0 时表示时间距离不产生影响,λ = ∞ 时表示只有时间产生影响;

hst 表示 k 样本对 prediction grid cell j 的衰减带宽

目前,在构建【论文阅读】Geographically and temporally weighted neural networks for ground-level PM2.5时只考虑权值大于 1E-6的样本点


cross-validation technique 来选择 λ 和 hst 的值。

还涉及到固定带宽(最邻近点数发生变化)还是可变带宽(最邻近点数不发生变化)的问题,本研究使用的是adaptive bandwidth

Model evaluation

常用的方法是10 fold cross-validation technique,又可以分成sample-based和site-based两种,其划分方式不太相同

① sample-based cross-validation:samples were divided into 10 folds 

效果:reflect the overall predictive ability

② site-based cross-validation:the grid cells containing monitoring sites  ( the “site” here refers to “grid cell”)

效果: the spatial prediction performance more reasonably.
