分享
基于车道目标引导的车辆轨迹预测.pdf
下载文档

ID:3076128

大小:5.29MB

页数:9页

格式:PDF

时间:2024-01-19

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 车道 目标 引导 车辆 轨迹 预测
2023 年(第 45 卷)第 8 期汽车工程Automotive Engineering2023(Vol.45 )No.8基于车道目标引导的车辆轨迹预测*连静1,2,李硕贤2,刘一荻3,杨东方3,李琳辉1,2(1.大连理工大学,工业装备结构分析国家重点实验室,大连116024;2.大连理工大学汽车工程学院,大连116024;3.重庆长安汽车股份有限公司,重庆400023)摘要 有效融入车道线信息对准确预测车辆未来行驶轨迹具有重要意义。针对预测模型在融合车道线信息时存在效率低的问题,提出一种基于车道目标引导的车辆轨迹预测方法(GSA),在通过图网络融合车道段的几何及位置信息的基础上,从注意力模型出发,构建一种直接的车道目标点预测模块,由此监督模型将与车辆运动相关联的车道目标特征有效地融合到车辆的运动特征中,并考虑到周围车道拓扑结构随时间的变化。通过两个改进残差结构的Transformer网络依次提取低层运动特征以及融合车道目标点在时间尺度下的前后关联信息,逐步更新车辆运动特征。构建基于图网络的交互融合模块,使车辆运动特征在全局范围内聚合与传播。通过在Argoverse以及长安汽车轨迹预测数据集下的实验,验证了本文所提出的GSA方法能够有效提高复杂交通场景下车辆轨迹预测的精度和质量。关键词:轨迹预测;地图特征编码;目标引导Goal Supervised Attention Network for Vehicle Trajectory PredictionLian Jing1,2,Li Shuoxian2,Liu Yidi3,Yang Dongfang3&Li Linhui1,21.Dalian University of Technology,State Key Laboratory of Structural Analysis for Industrial Equipment,Dalian116024;2.School of Automotive Engineering,Dalian University of Technology,Dalian116024;3.Chongqing Chang an Automobile Co.,Ltd.,Chongqing400023Abstract Effectively integrating lane information is significant for accurately predicting the future trajectory of vehicles.For the low efficiency problems existing in the fusion of lane information of the prediction model,a vehicle trajectory prediction method of Goal Supervised Attention(GSA)is proposed.Based on fusing the geometric and position information of the lane segment through the graph network,a lane goal prediction module is constructed in this paper starting from the attention model to directly supervise the model to fuse the lane goal features associated with vehicle motion into the vehicle s motion characteristics while encoding changes in the surrounding lane topology over time.Through two Transformer networks with improved residual structure,low-level motion features are extracted and the correlation information of the lane goal at the time scale is fused sequentially to gradually update the vehicle motion features.An interaction fusion module based on a graph network is constructed to aggregate and propagate vehicle motion features globally.Experiments on the Argoverse and Changan vehicle trajectory prediction datasets show that the proposed GSA method can effectively improve the accuracy and quality of vehicle trajectory prediction in complex traffic scenarios.Keywords:trajectory prediction;map feature encoding;goal guided doi:10.19562/j.chinasae.qcgc.2023.08.006*国家自然科学基金(61976039,52172382)、中央高校基本科研业务费专项资金(DUT22JC09,DUT20GJ207)和大连市科技创新基金(2021JJ12GX015)资助。原稿收到日期为 2022 年 12 月 12 日,修改稿收到日期为 2023 年 01 月 31 日。通信作者:李琳辉,副教授,博士,E-mail:。汽车工程2023 年(第 45 卷)第 8 期前言为了使自动驾驶车辆能在各种交通场景中作出正确决策,提前预测周围车辆的意图或运动轨迹是必要的。车道线作为车辆行驶的参考线,对于准确预测车辆未来的运动轨迹具有重要意义。传统轨迹预测模型由于受到硬件水平的制约,模型容量较小,因此通常需要结合知识或规则系统来推理出车道参考线。例如文献 1 中,作者提出通过隐马尔科夫模型与知识推理得到车辆的动作意图,然后根据动作意图查询得到车辆的目标路段区域,并生成车辆到达该区域的目标轨迹。而在文献2 中,作者以通过知识推理得到的车道参考线来引导长短时神经网络(LSTM)生成未来轨迹,利用深度学习在一定程度上降低了文献 1 中对于知识系统的依赖,但其中的知识系统仍需要随各种环境因素的变动来反复更新和维护。近些年来随着图神经网络(GNN)、注意力网络的发展,研究者常将车道线以及车道拓扑转换为利于编码的向量化结构,并通过这类网络来将车道线信息引入到车辆运动特征中3-5,与传统方法不同,这类方法通常将周围所有车道进行编码,并让网络自适应地融合与驾驶目标或局部参考线相关联的车道特征,有效地编码及融合车道特征,并减少信息损失,是这类模型研究的发展趋势。例如VectorNet6提出将车道段视为向量,采用池化来聚合向量中各个分段的几何与位置信息,并用图网络来融合车道段特征,HiVT5、LaneGCN7、LaneRCNN8将各个车道分段视为独立的图节点,相比VectorNet提高了车道节点特征的空间精度,并发挥注意力网络所具有的灵活感受野的优势,由此更细致地感知周围车道信息。MMPT9则将车道分段与车道同时用一个多尺度模型编码,由此学习不同层次的车道特征。LaneGCN沿地图拓扑结构建立了车道图网络,使场景信息能够沿车道各个可能的行驶方向传播,而LaneRCNN在此基础上拓展了候选车道范围的定义(LaneRoI),由此增强对车道与车辆运动的关联性的建模。这类在车道拓扑结构上应用图网络的模型虽然有效地融合了车道信息,但在车道拓扑结构复杂的场景下,会消耗较多计算资源。一些研究在利用上述方法实现车道信息融合的基础上,引入额外的监督信号,提高与车辆运动相关联车道特征的影响。例如PGP10基于对道路拓扑结构的编码结果,预测未来车辆经过某个道路点时的移动方向,根据概率沿道路方向采样并聚合道路特征。另外一些研究对运动目标进行预测,例如DSP11、DenseTNT12中预测道路中的稠密目标点,并融合与目标点相关联的车道特征,由此提高车道信息融合的有效性,但DenseTNT与DSP因为仅预测最终目标点,对连续时间关联下的车道信息建模不足,且对于稠密道路目标点的编解码,消耗运算资源较多。PGP则考虑到对连续时间内的车道信息监督,使车道采样在时间上前后关联,但在特征聚合的过程中弱化了这种时间前后关联的影响,且其采样过程增加了不确定性,使训练效果受限。以高效融合车道信息提升多样化交通场景下车辆轨迹预测的精度和质量为目标,本文所作出的主要创新点在于:(1)提出一种基于注意力的车道目标点预测分支,由此监督编码器高效地融合与智能体局部运动目标相关联的车道特征。(2)构建车道时空特征。基于图网络来感知车道与智能体间的空间联系,并采用Transformer来感知智能体连续运动对应的车道目标点的时序关联信息。(3)基于随机深度与层缩放改进Transformer的残差结构,提高Transformer对测试数据的泛化能力。本文所提出的模型结构如图1所示,通过时序编码器A编码得到浅层智能体特征。然后在各个历史时间步下,通过车道特征融合模块与车道目标点预测模块,融合与车辆连续运动目标直接关联的车道特征,并将车道特征融合模块更新的智能体特征送入时序编码器B,感知车道目标在时间尺度下的前后关联信息,更新得到深层智能体特征,之后通过交互融合模块,提取智能体间的交互特征,同时使局部车道目标信息在全局场景中产生进一步关联。最后由轨迹预测模块解码得到多模态运动轨迹。1轨迹预测问题定义对于一个场景,记 t=-h:0为场景的历史时刻,t=0:f 记为场景的未来时刻,相邻时刻间的时间间隔恒定。轨迹预测问题的定义是:已知场景中每一个智能体Ai在 t=-h:0内的位置点Hi,t,需要预测Ai在 t=0:f 内的位置点Fi,t,同时考虑K种可 13542023(Vol.45)No.8连静,等:基于车道目标引导的车辆轨迹预测能运动模式,则运动模式k 0,K 下的运动位置点为Fk,i,t,运动模式k对应整个未来时间段下的轨迹为Fk,i,Fk,i的置信度为Pk,i,t=0:f 内的真实运动轨迹记为Li,t。2时序编码器近年来Transformer在自然语言处理领域的成功证明了其对于时间序列的表征能力,其全局感受野对于提取不同尺度的时序特征较为有利。本文采用Transformer来编码智能体的运动特征,首先由智能体的历史位置序列Hi,t求出步长为 1 的坐标增量Hi,t,由此表示车辆的瞬时方向、瞬时速度信息,为避免轨迹填充引起Hi,t中出现异常值,通过轨迹有效时间戳来将Hi,t中的无效位置处理为零。然后通过一组MLP将H投影到维度为d的特征空间作为初始的智能体序列特征ei,t。考虑到 Transformer 的置换不变性而无法感受到不同元素的相对位置关系,本文通过初始化一组带有梯度的参数作为时间嵌入t,其长度为h,维度为d,并通过与ei,t拼接及维度变换得到新的智能体序列特征ei,t。MultiPath+13中提出用一组与输入无关的可学习参数来建立一种智能体特征样本库,并建立智能体特征与这组参数之间的映射关系,从中查询得到智能体特征,本文在此基础上进行简化,将可学习参数拼接在智能体序列特征ei,t的尾部,使序列特征长度扩展至h+1,然后来实现上述特征映射的过程。本文构建如图2所示的Transformer模块来实现时间序列编码。参考原始的 Transformer 模型构建两个残差模块,分别计算自注意力特征与全连接特征,在自注意力特征的计算中,通过层归一化与MLP将智能体序列特征映射为Qt、Kt和Vt特征:Qt,Kt,Vt=Q(ei,t),K(ei,t),V(ei,t)(1)然后由Qt和Kt计算序列中元素t1相对于其余任一元素t2的注意力系数t1,t2,其中t1、t2 t,t=-h0:t1,t2=QTt1Kt2(2)根据有效时间戳序列构造填充掩膜来将式(2)所得到的注意力系数中的无效位置替换为负无穷,通过Softmax使这些位置的注意力系数趋近于0,由此消除无效数据对序列特征的影响,然后计算得到新的序列特征:图1GSA 模型架构图图2Transformer编码器结构 1355汽车工程2023 年(第 45 卷)第 8 期eatti,t1=()Softmax(t1,t2)dVt1|t1,t2=-h-1:0(3)本文采用多头注意力来稳定训练,即将Qt、Kt、Vt特征均分为g组,使批大小(batch size)扩大为g倍,每组特征的维度为1 g,在完成注意力计算后,通过拼接多头特征来得到最终的注意力特征。接下来,通过层归一化与MLP依次对注意力特征进行变换,得到全连接特征:effni,t1=ffn(eatti,t1+ei,t1)(4)最后引入残差求出新的智能体特征:ei,t1=eatti,t1+ei,t1+effni,t1(5)为了减少过拟合效应,本文在残差路径上引入随 机 深 度14与 层 缩 放15,其 中 的 随 机 深 度(stochastic depth)是 Dropout 在残差路径上的扩展,即训练过程中的残差路径有一定的概率被遗弃,该概率随着层数加深而增加,即pl=1-lL(1-pL)(6)式中:pl为第l层的遗弃概率;L为总层数;pL为最后一层的遗弃概率。通过设置随机深度,可以使浅层网络中对于学习有帮助的特征从更短的路径传到深层网络中。而层缩放(layer scale)是对每一层的残差特征在特征维度上进行独立的缩放,使不同通道特征的差异更丰富,即e=wls e(7)式中:e、e分别为原始残差特征与更新的残差特征;wls为的可学习权重。通道数为d。本文通过级联多个Transformer模块来构建时序编码器A与时序编码器B,并以t=0的智能体序列特征ei,t|t=0作为智能体嵌入bi,由此参与后续的编码。3场景信息融合模块3.1融合模块的网络结构对于邻域元素信息的融合,图网络的显著优势在于在不同的批次下,待融合元素的数量可以不同,因此使用图网络结构能够满足车辆周围的有向车道段、周围智能体数量动态变化的特点。本文构建如图 3 所示的图网络来融合车道特征与周围智能体特征。以一种简单情况解释本文所构建的图网络:假设车辆Ai周围存在3个邻域元素Aj,j j1,j2,j3,将Ai节点特证ei经过MLP投射为Qi,将Ai与Aj之间的边特征ei,j与Aj节点特征ej拼接并经过另一个MLP投射为Kj和Vj特征,通道数为d,根据式(1)得到Aj对Ai的注意力值:j=SoftMaxjc=1d()Qi,c Kj,cd(8)将注意力系数j作为权重,对Vj加权求和来将邻域元素Aj(j j1,j2,j3)的特征融合到Ai中,得到残差特征eresi,即eresi=j j1,j2,j3(Vj j)(9)本文采用了基于点乘的注意力计算方式来对不同长度的邻域元素实现并行编码,相比于原始的图注意力网络的注意力模块,无额外的网络权重,计算效率更高。接下来添加全连接层来提高模型的表达能力,并将注意力特征与全连接特征构建为残差形式来提高泛化性能,得到更新后的Ai的特征ei:eresi=1(ei+eresi)(10)ei=2(eresi)+eresi(11)式中:1、2表示层归一化;表示全连接层的MLP网络结构。3.2车道特征融合模块车道拓扑结构能够为轨迹预测提供多模态先验信息。为此,基于3.1节中的图网络结构来融合智能体周围的有向车道段特征。随着车辆的行进,特定距离内的有向车道段会发生变化,因此对各个历史时刻t,按照有向车道段对应线段中点到该时刻智能体位置点间的距离来筛选出一定范围的有向车道段Nj,t,根据有向车道段向图3图网络结构 13562023(Vol.45)No.8连静,等:基于车道目标引导的车辆轨迹预测量坐标经MLP得到节点特征ej,t,而一系列连续的有向车道段包含了车道方向、车道分支、弯道曲率半径等信息。为了进一步使网络感知到有向车道段的连续性,并提取其与智能体之间的相对关系,根据有向车道段Nj,t对应的线段中点在智能体Ai局部坐标系下的坐标经MLP得到智能体与车道段间的边特征ei,j,t,智能体Ai的节点特征为时序编码器A输出的特征ei,t。这样便得到如图4所示的有向车道段与智能体间的时空图结构,即Gi,t=ei,t,ej,t,ei,j,t(12)接下来将3.1节中的图网络结构扩展为h组,对Gi,t进行编码,得到新的智能体特征ei,t。在此之后,采用图1中所述的时序编码器B来进一步使有向车道段特征与智能体运动特征融合,并以t=0的智能体序列特征ei,t|t=0作为智能体嵌入bi。3.3交互融合模块智能体间的交互与即将发生的行为直接关联,因此在车辆之间进行特征的融合与传递,更有助于网络提取场景层面的信息。一方面经过时序编码器B的编码,智能体的自身运动特性被充分提取,并需要通过全局交互编码来融入更多高层次的决策信息学习;另一方面因为融合了有向车道段特征,可通过全局交互编码来进一步感知出全局的道路拓扑结构,并补充对智能体轨迹预测有利的额外特征。本文选取当前时刻来进行全局交互编码,即在当前时刻下,建立任意两个智能体Ai与Aj之间的连接,与3.2节所述类似,以某个智能体自身以及邻域智能体的嵌入bi与bj分别作为节点特征ei与ej,根据邻域智能体Aj在智能体Ai下的相对坐标经 MLP得到各智能体间的边特征ei,j,t,至此得到如图5所示的智能体间的交互图结构:Ii,t=ei,ej,ei,j,t(13)经过3.1节中的图网络编码,实现全局交互特征的提取,得到更新后的智能体嵌入bi。4多任务预测模块4.1车道目标点预测模块在多数融合车道信息的车辆轨迹预测模型中,车道编码器参数由间接的监督信号计算梯度,并由优化器更新,即按照反向传播的原理,轨迹预测回归与分类产生的梯度依次通过车道编码器与轨迹解码器中间的各层反向传递至车道编码器,使编码器难以直接高效地表征车道结构与未来车辆运动的关联,且使车道信息的融合过程不再具有可解释性。本文提出一种能够通过预测目标有向车道段,由此使车道编码器学习车辆未来运动目标处的车道信息的监督分支方法。车道目标点预测模块见图6。由图6可见,在车道数据预处理阶段,处理得到未来候选目标向量掩膜以及车道目标向量标签,其中候选目标向量掩膜根据车辆当前的行驶方向来进行筛选,即沿车辆行驶方向查询距离该向量一定距离范围之内的有向车道段,作为未来候选目标向量,并在未来候选目标向量中计算与各个时刻轨迹点最接近的目标向量标签,然后为未来候选路段生成一组特征嵌入ei,j,并与原始的有向车道段特征ej,t拼接,经过MLP维度变换来更新有向车道段特征。之后根据3.2节中的车道特征融合模块进行编码,对th=n(n=-h0)时刻下智能体对周围车道段的多头注意力系数进行求和以及Softmax运算,得到未来时刻tf=f+n(n=-h0)下的目标点,即以连续历史时刻下的车道段注意力系数j,th作为未来相同长度连续时刻的目标车道点的分类得分j,tf。然后,基图5智能体与周围车辆间的图结构图4t时刻下智能体与周围车道段间的图结构图6车道目标点预测模块 1357汽车工程2023 年(第 45 卷)第 8 期于交叉熵计算目标分类损失lossgoal来监督网络融合车辆目标点附近的车道特征。车道目标点预测分支能够监督车道特征融合模块自适应地学习与车辆局部运动目标相关联的车道信息,因此后续时序编码器B能够进一步编码智能体不同时刻局部目标点之间的时序特征,同时交互融合模块能够使不同智能体之间与车道目标相关联的特征在全局范围内充分传播,进一步实现车道目标的引导作用。4.2轨迹预测模块为了获得多模态预测轨迹,将3.3节中更新的智能体嵌入输入K组MLP进行解码,得到K个模态的未来轨迹及对应的置信度。由于同时预测多个模态,损失函数需要引导网络预测得尽可能接近真实的轨迹,同时为最接近真实轨迹的模态赋予最高的置信度。因此本文采用广泛应用于多模态轨迹预测的轨迹回归与分类监督方式,以平均距离最接近真值的轨迹对应的模态为最佳模态,然后对该条轨迹与真实轨迹作SmoothL1回归损失lossreg,使预测结果其尽可能接近真实轨迹。并对该模态作交叉熵分类损失losscls,使该模态对应的置信度尽可能高。4.3训练损失最终的训练损失为在4.1和4.2节中所述3种损失的线性组合,即loss=(1-)losscls+(1-)lossreg+lossgoal(14)其中的线性系数与在初期实验测试阶段分别设置为0.2与0.8,由此使车道目标点预测达到辅助轨迹预测的效果。5实验结果及分析5.1实验设置本文应用 Argoverse 运动预测数据集16来进行训练和测试,并与主流模型进行对比,该数据集覆盖了多样化的城市交通场景,并且提供了矢量存储的高精度地图,其中训练集与验证集分别包含205 942、39 472个样本。该数据集提供 2 s历史轨迹,并预测6种模态下的3 s未来轨迹,时间间隔为0.1 s。采用Argoverse运动预测数据集定义的性能指标,即用最小轨迹终点偏移误差(minimum final displacement error,minFDE)、最小平均轨迹偏移误差(minimum average displacement error,minADE)和错失率(miss rate,MR)来评估模型的性能。为了进一步验证模型的泛化性能,本文在长安汽车数据集下训练及测试,长安汽车数据集涵盖国内多个地区的城市道路、结构化公路场景中车辆的轨迹数据,用于训练及验证的数据集分别包含67 117、16 857 个样本。轨迹数据的时间间隔为0.1 s,时长为12 s,其中前4 s作为观测历史,选择预测3及8 s的未来时长进行轨迹预测,采用最小轨迹终点偏移误差minFDE与错失率MR两个指标进行评估,与Argoverse实验设置不同的是,选择预测模态数为1来满足实际下游任务的需求。本文中在RTX3090 GPU上训练所提出的模型,在 Argoverse 数据集下采用的特征通道数 d=128 或d=256,分别用GSA-S和GSA-L表示,在长安汽车数据集下采用 d=128。两个时序编码器中采用的Transformer数量均为3,Transformer与图网络中的注意力头数均为8,随机深度数值为0.1。训练的优化器为AdamW17,除归一化层、偏置参数以及正余弦时间序列嵌入参数外,其余参数设置权重衰减系数均为1.0E10-3,以减轻训练集过拟合。学习率设置为0.000 1,并采用余弦衰减策略调整学习率。5.2验证精度与主流方法的对比实验在 Argoverse 验证集下对所提出的 GSA 方法进行测试,定量测试结果如表 1 所示。GSA-L 在minADE、minFDE、missRate指标上均优于目前主流模型,与DSP相比,minADE降低7.3%,minFDE降低6.1%,missRate 降 低 20.0%,与 LaneGCN 相 比,minADE降低9.9%,minFDE降低15.6%,missRate降低 27.3%。因此本文所提出的 GSA 模型在预测精度、预测整体质量上具有明显优势。GSA-L与GSA-S相比具有更大的模型容量,从表1可知,GSA-L比GSA-S性能进一步提升。表2是长安汽车数据集下不同预测时长的测试结果,K=1为下游任务通常实际所用到的模态数量。在该条件下,预测模型面临的不确定性因素增加,GSA模型在3 s的情况下有81%的场景预测结果未漏失,而在8 s情况下,有44%的场景预测结果未漏失,对应的minFDE分别为2.12、9.18 m。由长安汽车数据集下的实验结果表明,GSA在路况更为复杂的国内交通场景下仍保持了良好的有效性。本文选取Argoverse验证集中的3个典型场景对预测结果进行定性分析,如图7所示。图中的行表示不同的交通场景,图中的列表示不同模型的推理 13582023(Vol.45)No.8连静,等:基于车道目标引导的车辆轨迹预测结果,第一列对应GSA模型,第二列对应DSP模型,第三列对应 LaneGCN 模型。图中的道路拓扑及其边界由灰色区域表示,待预测智能体过去2 s的观测轨迹由橙色轨迹表示,未来3 s的预测轨迹由红色轨迹表示,多模态预测结果由绿色表示。在场景1中,目标车辆位于左转与直行车道上,即将通过路口,此时 GSA相比于 LaneGCN 模型更准确地预测出直行轨迹,而DSP模型未能给出准确预测。对于可能出现的左转,GSA给出了更为合理的内切轨迹,而另外两个模型预测的轨迹倾向于外切。在场景二中,目标车辆从道路一侧出发,调整方向后驶向路口。此时GSA相对准确地预测出直行轨迹,另外两个模型未能准确预测直行轨迹,且GSA预测结果中的各种可能性分布较为分散,多模态特性更为显著。在场景3中,待预测目标在路口处加速,并由于某种路况原因靠近道路左边界,此时GSA模型捕获了路况变化,并预测出这种情况下的目标轨迹,而且对于可能的左转 GSA预测出更为合理的内切轨迹。另外两种模型未捕获到路况的变化,因此直行模态仅预测出车辆一直加速的轨迹。表明 GSA模型中所采用的分阶段时序编码器能够充分提取历史运动信息,因此能够相对准确地推理出车辆的低层次运动特征,例如准确推理出直线加速时的最终位置;而连续车道目标点预测辅助下的车道特征融合则能够更为直接地融合与智能体运动相关联的车道信息,例如能够预测出左转时多数驾驶员会采取的内切轨迹,此外,交互融合模块能够融合场景中的动态交通信息,例如捕捉到场景3中的动态路况变化,来适当地调整完全沿道路中心行驶的轨迹,使预测结果更合理。5.3GSA中主要模块的消融实验本文通过消融实验来验证 GSA 中各主要模块的作用。消融训练过程中验证指标随轮次的变化如图8所示。图8中模型1表示未进行消融的GSA-S模型,在模型2中,去除GSA-S中的车道目标点预测模块;在模型3中,将GSA-S中的交互融合模块中的图网络替换为采用互注意力的Transformer结构。可以看到,各个模型在前半部分中的差距不明显,在后半部分则逐渐显示出差距,并收敛到不同值,模型2与模型 3最终收敛时的 minADE、minFDE 均大于模型1的收敛值,模型2的曲线说明车道目标点预测模块对精度指标有小幅度的影响。模型3的曲线说明对于交互融合模块,图网络相比于Transformer具有更好的性能。一方面本文所构建的图网络具有与Transformer类似的全连接层与残差结构,提高了图网络自身的泛化性能,另一方面,图网络可以对智能体间的相对关系进行显式的表达与编码,即将智能体相对位置坐标作为有向边的属性进行编码,更适合于具有明显交互属性的动态交通场景,并实现智能体特征的聚合与传播。消融实验结果证明本文所提出的主要模块均对验证精度具有正向作用。为了进一步验证车道目标点预测模块的作用,在Argoverse数据集下选取两个场景,可视化最终时表1Argoverse验证集下预测性能指标对比模型MultiPath18TPCN19LaneGCN7MMTr.20DenseTNT12PAGA21DSP11GSA-SGSA-LminADE6/m0.800.730.710.710.730.690.690.640.64minFDE6/m1.681.151.091.081.051.020.980.930.92missRATE6/%14111110101098表2长安汽车数据集下预测性能指标预测时长/s38minFDE1/m2.129.18missRATE1/%1956图7典型场景下的预测结果对比 1359汽车工程2023 年(第 45 卷)第 8 期刻预测出的车道目标点。如图9所示,蓝色的星形表示预测出的车道目标点,颜色越深表示得分越高,红色与黄色轨迹分别表示观测的未来与历史轨迹,从这两个场景中可以看出,在目标车辆转弯情况下,车道目标点预测模块能够准确预测车道目标点,因此,可进一步通过本文所提出的车道目标引导机制,融合与运动目标直接相关的车道目标信息。6结论针对车辆轨迹预测任务中如何高效提取车道特征的问题,本文提出了一种基于目标车道引导的轨迹预测方法,该方法基于注意力网络构建有效且直接的目标预测分支,从而引导网络融合与运动目标直接关联的车道信息,并在连续时间范围内编码车道拓扑信息变化,通过Transformer提取车辆低层运动信息,以及融合车道特征在时间尺度下的前后关联信息,其中Transformer的残差层经过改进,提高多层编码时的性能。在Argoverse下的实验结果表明,本文所提出的方法在各个指标上显著优于目前主流预测模型,同时在长安汽车数据集下的实验结果证明本文方法对于实际复杂路况场景具有较好的泛化能力。参考文献 1 耿新力.城区不确定环境下无人驾驶车辆行为决策方法研究 D.合肥:中国科学技术大学,2017.GENG X L.Research on behavior decisionmaking approaches for autonomous vehicle in urban uncertainty environments D.Hefei:University of Science and Technology of China,2017.2 王少博 动态场景下基于交互性预测的自动驾驶汽车轨迹规划方法研究 D.合肥:中国科学技术大学,2020WANG S B.Research on interaction-aware predictive trajectory planning for autonomous vehicle in dynamic environments D.Hefei:University of Science and Technology of China,2020.3 GILLES T,SABATINI S,TSISHKOU D,et al.Gohome:graph-oriented heatmap output for future motion estimation C.2022 International Conference on Robotics and Automation(ICRA).IEEE,2022:9107-9114.4 NGIAM J,VASUDEVAN V,CAINE B,et al.Scene transformer:a unified architecture for predicting future trajectories of multiple agents C.International Conference on Learning Representations(ICLR).OpenReview,2022:5 ZHOU Z K,YE L Y,WANG J P,et al.HiVT:hierarchical vector transformer for multi-agent motion prediction C.Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).IEEE,2022:8823-8833.6 GAO J Y,SUN C,ZHAO H,et al.VectorNet:encoding HD maps and agent dynamics from vectorized representation C.Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).IEEE,2020:11525-11533.7 LIANG M,YANG B,HU R,et al.Learning lane graph representations for motion forecasting C.European Conference on Computer Vision(ECCV).Springer,2020:541-556.8 ZENG W Y,LIANG M,LIAO R J,et al.LaneRCNN:distributed representations for graph-centric motion forecasting C.IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS).IEEE,2021:532-539.9 HUANG Z Y,MO X Y,LV C.Multi-modal motion prediction with transformer-based neural network for autonomous driving C.International Conference on Robotics and Automation(ICRA).IEEE,2022:2605-2611.图8消融模型的验证性能指标的变化曲线图9转弯场景中模型预测出的车道目标 13602023(Vol.45)No.8连静,等:基于车道目标引导的车辆轨迹预测 10 DEO N,WOLFF E,BEIJBOM O.Multimodal trajectory prediction conditioned on lane-graph traversals C.Conference on Robot Learning(CoRL).PMLR,2022:203-212.11 ZHANG L,LI P L,CHEN J,et al.Trajectory prediction with graph-based dual-scale context fusion C.International Conference on Intelligent Robots and Systems(IROS).IEEE,2022:12 GU J R,SUN C,ZHAO H.DenseTNT:end-to-end trajectory prediction from dense goal sets C.Proceedings of the IEEE/CVF International Conference on Computer Vision(ICCV).IEEE,2021:15303-15312.13 VARADARAJAN B,HEFNY A,SRIVASTAVA A,et al.Multipath+:efficient information fusion and trajectory aggregation for behavior prediction C.International Conference on Robotics and Automation(ICRA).IEEE,2022:7814-7821.14 HUANG G,SUN Y,LIU Z,et al.Deep networks with stochastic depth C.European Conference on Computer Vision(ECCV).Springer,2016:646-661.15 TOUVRON H,CORD M,SABLAYROLLES A,et al.Going deeper with image transformers C.Procee

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开