2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation

Physics Informed Deep Learning for Traffic State Estimation

文章问题及解决方法

问题:交通状态估计 (TSE) 的挑战在于观察到的交通数据的稀疏性和数据中存在的传感器噪声。

  1. 交通数据的稀疏性
    交通数据的稀疏性是因为我们无法在道路的所有地面全部铺满传感器,所以总有一些地面段的交通数据我们无法得知;同时,道路上行驶的大部分是非理想状态下的网联车辆,我们也无法得到每个车辆的具体行驶状态。

  2. 交通数据具有噪声
    交通数据存储和传输的限制以及网络问题,传输设备记忆接收设备的故障。

解决方法:本文提出了一种新的方法–物理信息深度学习(PIDL)方法,以解决这个问题。PIDL为深度学习神经网络配备了管理交通流的物理规律的力量,以更好地估计交通状况。

INTRODUCTION

交通状态的重要性

宏观交通状态变量,如流速f、平均车速v和车辆密度ρ,表示交通网络中各路段的交通状况。通过这些指标,交通规划者可以感知拥堵程度,识别交通需求,甚至可以识别道路网络的阻塞和瓶颈。因此,交通状态估计(TSE)成为一项重要任务。它指的是利用部分观察到的交通数据推断出道路段的交通状态变量。准确的实时TSE对于有效的交通管理是至关重要的,因为控制策略会相应地实施。

基于模型驱动的方法

模型驱动的方法采用交通流理论模型来估计交通状态。诸如小区传输模型(CTM)[和开关模式模型(SMM)等模型已被用来表示交通流。卡尔曼滤波器及其扩展通常被用来有效地解决TSE和校准这些模型。卡尔曼滤波器及其变化估计了与观测数据、假定系统模型和噪声有关的最可能的状态变量。

基于数据驱动的方法

随着统计方法和机器学习的发展,数据驱动的TSE利用历史上观察到的交通数据的力量来进行估计任务。这使得机器本身可以发现交通数据的基本结构,消除了采用适合每个路段的交通流模型的要求。核回归、概率主成分分析和深度学习等数据驱动技术已被应用于这种方法。

本文提出的新方法

与盲目地将交通数据输入深度学习神经网络的方法相比,交通流理论的基本原则可以帮助训练神经网络,并帮助发现埋藏在数据中的交通状态变量之间的隐性关系。这建立了一个快速、有弹性和计算友好的TSE方法。
本文提出了一种新的交通状态估计方法,将深度学习神经网络与交通流理论的物理学相结合,称为TSE的物理学知情深度学习(PIDL)。传统的TSE方法和拟议的PIDL之间的关系如图1所示。
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State EstimationRelationship between Traffic State Estimation Approaches

PHYSICS OF THE TRAFFIC FLOW

交通状态的描述

流动率q表示在单位时间内通过设定地点的车辆数量。平均速度v是在一个路段上行驶的车辆的速度平均值。密度ρ描述了单位道路空间内的车辆数量。这些时间序列量共同显示了交通状况的时间发展。
累积流量N(x, t)表示在时间t前已经通过指定地点x的车辆数量。流量q(x, t)是累积计数N(x, t)相对于t的偏微分。密度ρ(x, t)是累积计数N(x, t)相对于x的偏微分。这种关系表现在公式(1)中。
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation

交通流守恒定律

Lighthill-Whitham-Richards(LWR)模型将流量q(x,t)、密度ρ(x,t)和车辆的累积数量N(x,t)联系起来。守恒定律由公式(2)给出,它也被称为LWR交通流PDE。
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation

交通流的基本图

之前并不是交通工程专业,所以对基础的交通流模型和交通流的基本图的概念很清楚。还需要请教老师。
交通流的基本图给出了交通状态变量q、v和ρ之间的关系,使我们能够假设平均驾驶行为。基本图有多种表现形式,其中一种被广泛使用,由于其简单性,是由Greenshields提出。2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
在Greenshields基本图中,交通状态变量之间的关系可以概括为,其中v f是*流速度,ρ m是最大密度(也称为堵塞密度)。

本章总结

如果采用的交通流模型能够准确说明现实中观察到的交通状态变量之间的关系,那么基于交通流物理学的模型驱动方法可以精确预测未观察到的地区(没有数据采集设备)的交通状态,并提供更高分辨率的交通状态数据(在数据采集地点)。然而,对交通流模型的依赖带来了在TSE中采用不精确模型的风险。使用常见的、经过验证的交通流模型在一定程度上降低了这种风险,然而,在发生交通事故或恶劣天气条件等异常情况时,估计的稳健性还有待提高。通俗来说,就是不鲁棒,无法适合于大部分的真实情况

DEEP LEARNING NEURAL NETWORK

数据驱动的交通状态估计方法从另一个来源解决交通流模型的准确性问题:道路上收集的数据本身。它不依赖于基于经验证据或历史经验制定的交通流模型,而是应用迅速崛起的机器学习技术来识别交通状态变量之间的关系。如果实时部署,机器学习算法会根据获得的输入数据,学习适应特定的环境模式,如拥堵和高峰期的交通。因此,与模型驱动的方法相比,数据驱动的方法的估计结果有望在交通异常情况出现时更加可靠。然而,所收集数据的松散性可能会将传感器或检测偏差带入神经网络,导致估计结果不太可靠。

PHYSICS INFORMED DEEP LEARNING FOR TRAFFIC STATE ESTIMATION

物理信息深度学习(PIDL)是一种深度学习(DL)方法,其中神经网络被训练来解决学习任务,同时尊重由一般非线性偏微分方程(PDE)给出的物理规律。由于固有的物理规律被编码为先验知识,由此产生的神经网络形成了数据有效的近似器来处理输入信息并给出预测结果。当输入数据不充分或有噪音时,PIDL允许神经网络在物理学的帮助下充分利用数据。它解释了数据中状态变量之间的基本关系,提高了预测结果。

PIDL损失函数

2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
交通流守恒定律建立了交通状态变量与位置x和时间t之间的关系,它需要被整合到PIDL神经网络的学习过程中。我们建立了两个措施来评估估计性能:1)DL成本,J DL,表示仅使用DL时的估计误差;2)物理成本,J P HY,表示估计中对守恒定律的不服从。(第一个就是单纯的深度学习的损失函数,利用计算预测值与真实值的MSE,最小化MSE来达到参数与结果的最优;第二个就是加上交通流守恒定律来再次约束,使结果最优。在这里,使公式(2)中左侧的部分越接近0来训练网络)
同时给两个损失函数前面加上一个系数,得到如下:
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation

PIDL训练过程

将收集到的交通状态数据集分成训练和测试数据集后,训练数据集被送入神经网络,PIDL进行估计。估算成本和物理成本都是根据结果来计算的。因此,神经网络通过将不遵守守恒定律的情况J P HY纳入成本函数J而获得支配物理规律的知识。如果估计成本和物理成本之和大于指定的阈值,训练迭代就会重复进行。否则,精确调谐的PIDL会将估计结果作为输出。允许的最大学习迭代次数–i max被设定为防止在总成本没有变化的情况下,学习过程永远运行下去。这些步骤在图2中得到了体现。
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation

实验设置

(我们在这里不过多探讨实验的设置)

我们进行了一项实验,以验证PIDL神经网络在TSE方面的能力。鉴于交通数据的稀少性,以有限的输入获得准确感知的能力是非常有价值的。为了进行比较,在没有物理学知识的情况下,建立了一个具有相同构架的深度学习(DL)神经网络。

首先,我们研究了一种情况,即检测到的交通流输入来自固定位置的传感器(欧拉测量框架)。其次,我们探讨了一种情况,即考虑来自随机位置的数据,以比较PIDL和DL的性能。第二种情况可以与使用探测车辆或连接车辆的GPS数据在拉格朗日参考框架下获得测量结果的情况进行比较。估算结果的准确性是通过使用精度指标(ACC)来评估的。

实验结果

1. 欧拉测量框架

2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
在物理学的帮助下,PIDL有效地利用了训练数据,相比之下,微不足道的训练样本不足以让DL神经网络获得对整个路段交通状况的深刻认识。在这种情况下,它产生了一个难以捉摸的估计结果。

我们进一步检查***不同的训练样本量***对PIDL和DL的估计结果的影响。使用250(0.1%的数据)到2500(1%的数据)的样本量作为训练数据,PIDL和DL估计的准确性和计算时间显示在图5。准确率和计算时间的结果是用不同(但相同大小)的随机选择的训练集进行5次重复实验的平均值。
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
结果显示,PIDL在所有的样本水平上都超过了DL的性能,幅度很大。它还表明,PIDL在更短的时间内产生了估计结果。

实验结论

该方案涉及使用固定位置的传感器的输入数据,并证明了PIDL在利用极其有限的数据来产生准确的交通状态估计结果方面的强大能力。结果突出了PIDL在TSE应用中的价值,在这种应用中,传感器(如环形探测器)通常被稀疏地安装在道路上的预定位置。它表明,交通流理论的知识(在这种情况下是LWR)可以有效地帮助深度学习神经网络利用有限的传感器数据来估计交通流状态。

2.朗格朗日测量框架

2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
两个神经网络都达到了可接受的估计精度。考虑到这次训练样本的时间和位置的差异,两个神经网络都需要较长的时间来给出估计结果。DL完成了更好的估计精度,而PIDL具有缩减计算时间的优势。

使用不同样本量的实验结果
2021.11.02阅读论文总结__Physics Informed Deep Learning for Traffic State Estimation
两个神经网络都有能力获得准确的估计结果,而且差别相对不大。

实验总结

获得训练数据的各种观察地点无疑提高了DL的能力,使其获得更准确的估计。然而,在实现类似的估计精度方面,PIDL以更快的速度收敛。计算时间的缩短使PIDL在实时应用中具有独特的优势,在这种应用中需要及时估计交通状态。

CONCLUSION

在本文中,我们提出了一种物理学上的深度学习(PIDL)方法,用于交通状态估计(TSE)。结合交通流的基本物理规律和深度学习技术,我们展示了PIDL利用极其有限的交通数据进行准确和实时TSE的强大能力。

该实验利用了由Lax-Hopf方法生成的合成数据集,因为现成的现场数据源是以时间上的聚合形式存在的,这阻碍了实现有意义的结果的任务。未来的工作应该通过使用时间分辨率更高的场数据来解决这个问题。此外,根据现场数据,应利用交通参数之间的确切关系和适当的校准过程。

上一篇:【阅读笔记】Inverting Gradients -- How easy is it to break privacy in federated learning?


下一篇:Self-Supervised Learning