温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
融合
Dropout
STM
GRU
车辆
轨迹
预测
吴晓建
第 50 卷 第 4 期2 0 2 3 年 4 月Vol.50,No.4Apr.2 0 2 3湖 南 大 学 学 报(自 然 科 学 版)Journal of Hunan University(Natural Sciences)基于融合Dropout与注意力机制的LSTM-GRU车辆轨迹预测吴晓建 1,2,危一华 1,2,王爱春 2,雷耀 2,张瑞雪 2(1.南昌大学 先进制造学院,江西 南昌 330031;2.江铃汽车股份有限公司,江西 南昌,330001)摘 要:在智能驾驶环境的车辆轨迹预测环节,为更好地获取环境车辆的轨迹时序特征,在长短期记忆神经网络(LSTM)基础上,嵌入Dropout层以增强网络泛化性,引入注意力机制予以预测效果影响较大的时序数据更大权重从而提高预测结果的可靠性,且将改进的LSTM模型与门控循环单元GRU模型结合,构建LSTM-GRU预测模型以进一步提升环境车辆轨迹预测的准确性.在此基础上,使用NGSIM公开数据集对模型进行训练、验证和测试.研究结果表明,融合了Dropout和注意力机制的LSTM-GRU神经网络轨迹预测模型相较标准的LSTM长短期记忆网络以及GRU门控循环单元,在预测较长时序的车辆轨迹上具有优势,提高了轨迹预测的准确性,降低了实际轨迹和预测轨迹之间的均方根误差和平均绝对误差.关键词:智能汽车;轨迹预测;长短期记忆神经网络;门控循环单元;注意力机制中图分类号:U461.91 文献标志码:AVehicle Trajectory Prediction Based on LSTM-GRU Integrating Dropout and Attention MechanismWU Xiaojian1,2,WEI Yihua1,2,WANG Aichun2,LEI Yao2,ZHANG Ruixue2(1.School of Advanced Manufacturing,Nanchang University,Nanchang 330031,China;2.Jiangling Motors Co.,Ltd.,Nanchang 330001,China)Abstract:In the environmental vehicle trajectory prediction link of intelligent driving,to obtain the trajectory timing characteristics of the surrounding vehicles more accurately,the dropout layer is embedded into the long short-term memory(LSTM)neural networks model to enhance network generalization,and the attention mechanism is introduced into LSTM to distribute larger weight to the time series data with a marked influence on the prediction effect,so as to improve the reliability of the prediction results.Subsequently,the improved LSTM model is combined with the GRU model(LSTM-GRU)to further improve the prediction accuracy of the surrounding vehicle trajectory.On this basis,the LSTM-GRU model is trained,verified,and tested using the NGSIM public dataset.The results show that,compared with the standard LSTM and GRU model,the LSTM-GRU model integrating dropout and attention mechanism has advantages in predicting the surrounding vehicle trajectory with a longer time 收稿日期:2022-04-04基金项目:国家自然科学基金资助项目(52262054,52002163,52062036),National Natural Science Foundation of China(52262054,52002163,52062036)作者简介:吴晓建(1985),男,江西赣县人,南昌大学副教授,硕士生导师 通信联系人,E-mail:文章编号:1674-2974(2023)04-0065-11DOI:10.16339/ki.hdxbzkb.2023155湖南大学学报(自然科学版)2023 年sequence,which improves the accuracy of trajectory prediction and reduces the root mean square error and mean absolute error between the actual and the predicted trajectory.Key words:intelligent vehicle;trajectory prediction;long short-term memory(LSTM)neural network;gated recurrent unit;attention mechanism经验丰富的驾驶员,能够依据其对环境障碍物移动趋势和潜在轨迹的准确判断,提前做出平稳而安全的驾驶决策.类似地,对于智能驾驶车辆,能对移动场景中的障碍物轨迹进行动态预测,是提升决策系统性能、做出更合理规划的关键.正如文献 1所阐述的:预测能力是进行稳健驾驶的核心,在何时执行某种行为的高级决策和短期的局部路径规划中极为重要.环境车辆轨迹预测方法主要分为两类,即基于运动学/动力学模型的轨迹预测方法和基于循环神经网络等数据驱动算法的轨迹预测方法2.Papadimitriou等3提出了一种基于五次多项式拟合的方法近似输出短时间内的车辆未来轨迹.Ammoun等4结合简化的自行车动力学模型和卡尔曼滤波算法,在十字路口场景下获得了较高的轨迹预测精度.为进一步提升预测效果,周兵等5考虑了环境因素的不确定性,提出了一种基于蒙特卡罗随机抽样的方法近似地获取附近车辆的未来轨迹概率分布,从而计算出发生碰撞的可能性和时间点.宋晓琳等6基于扩展卡尔曼滤波算法和等加速度变化率、等横摆角加速度车辆运动学模型,对环境中存在碰撞风险的车辆的轨迹实现了有效预测.值得注意的是,由于真实交通场景具有复杂性及不确定性,基于模型的轨迹预测方法在中长期的预测效果往往不佳.为提高预测时域在2 s以上的中长期轨迹预测效果,诸如循环神经网络等基于数据驱动的方法,将驾驶意图的识别融入中长期的车辆轨迹预测,得到了广泛关注和深入发展.Wiest等7将车辆的非线性轨迹预测问题转化为回归问题,提出了一种基于时间序列的高斯混合概率分布模型,提高了在长期预测上的可靠性.Gindele等8设计了一种能够学习交通参与者非线性连续轨迹的分层动态贝叶斯模型,相较于基于运动学的方法,实现了中长期轨迹上预测精度的显著提升.随着LSTM在语言翻译9、文本分析和金融数据等方面的成功运用,LSTM和其他包括门控循环单元(Gated Recurrent Unit,GRU)10在内的基于 RNN循环神经网络的变体也开始被运用在车辆时序轨迹预测上.季学武等11基于LSTM长短期神经网络提出了一种融合驾驶意图的车辆轨迹预测模型,并考虑目标车辆左前、正前、右前、左后、正后、右后邻近车辆的历史轨迹信息,进一步提高了轨迹预测的准确性.黄玲等12通过研究车辆在换道途中与周围环境车辆的交互作用,引入道路横向偏移量等信息,构建了LSTM-LC车辆换道预测模型,并与标准模型进行对比,验证了其所提出的改进模型对换道行为具有更强的表征能力.Xie等13结合卷积神经网络的空间拓展压缩能力和长短期记忆神经网络在时间序列上的学习能力,提出了CNN-LSTM网络结构,实验证明,结合二者特征的预测模型在性能上相较基础的网络结构得到了提升.为了更好地获取车辆历史轨迹中的时序特征,进一步提升网络在不同场景下输出精度与泛化能力,本文提出一种结合GRU和LSTM的双层深度学习网络结构,嵌入Dropout层并引入注意力机制,以美国联邦公路管理局发布的NGSIM(Next Generation Simulation)数据集为网络训练集样本库,对模型进行训练、验证和测试.结果表明,LSTM-GRU的预测模型较仅基于门控循环单元神经网络或长短期记忆网络的预测模型,在预测精度与模型泛化性上均有显著提升.1 模型与框架本文所提出的模型框架主要由两部分组成,即改进的 LSTM 长短期记忆网络和 GRU 门控循环单元,模型的输出性能与网络的内部结构直接相关.1.1 标准模型为解决RNN循环神经网络梯度消失问题,Hochreiter 等14在 RNN 内部添加了两道控制门,提出了LSTM长短期记忆网络;而后为了使网络对时序数据具有持续的学习能力,Gers等15在LSTM基础上增添了一道遗忘门以便于网络自适应地放弃一些不重要66第 4 期吴晓建等:基于融合Dropout与注意力机制的LSTM-GRU车辆轨迹预测的信息.经实验证明16,相较于输入门与输出门,遗忘门是LSTM中最重要的信息流控制门,而包含遗忘门的长短期记忆网络也逐渐发展成标准的LSTM结构;此外,由于各个门的激活函数产生的非线性输出,LSTM长短期记忆网络具有结构上的鲁棒性17.Gers等提出的LSTM结构如图1所示.首先利用遗忘门决定从历史状态中丢弃哪些历史状态信息,sigmoid层的输出在0到1之间,当遗忘门的输出为1时,表示完全保留上一步中的历史状态信息;反之,则表示清空在此之前的所有历史状态信息:ft=(Wf ht-1,xt+bf)(1)输入门决定LSTM学习的新信息:it=(Wi ht-1,xt+bi)(2)利用遗忘门和输入门更新状态单元:Ct=tanh(Wc ht-1,xt+bc)(3)Ct=ft Ct-1+it Ct(4)最终由输出门决定的输出信息:ot=(Wo ht-1,xt+bo)(5)ht=ot tanh(Ct)(6)GRU 在结构上与 LSTM 相似,均为添加门控单元的RNN循环神经网络.区别在于,GRU将LSTM的遗忘门与输出门融合为改进的更新门,且进一步合并了短期状态和长期状态.由于参数的减少,GRU在网络训练过程中收敛速度更快,在部分场景下,GRU相较LSTM有更好的表现.图 2 所示的 GRU 结构中,各控制门的输出分别为:zt=(Wz ht-1,xt)(7)rt=(Wr ht-1,xt)(8)h?t=tanh(W rt ht-1,xt)(9)h?t=(1-zt)h?t-1+zth?t(10)其中,(x)=11+e-x即S型函数,把输入的信息流控制在(0,1)的范围内;tanh(x)=ex-e-xex+e-x 即双曲正切函数,是神经网络常用的一种非线性激活函数,可以将函数的输入转化为(-1,1)内的输出,ht-1与Ct-1分别为上一时序的短期状态与长期状态,ht与Ct分别为当前时序获得的短期状态与长期状态,xt为输入,表示点乘,即矩阵内对应元素进行相乘,Wf、Wi、Wc、Wo 、Wz、Wr、W为门控参数矩阵,bf、bi、bc、bo为控制门所设置的状态偏置.1.2 Dropout层在模型的训练过程中,神经网络不可避免出现一定程度的过拟合现象,该现