温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
增强
上下文
信息
长短
记忆
网络
弹道
轨迹
预测
任济寰
第 44 卷第 2 期2 0 2 3 年 2 月兵工学报ACTA AMAMENTAIIVol 44 No 2Feb2023DOI:10 12382/bgxb 2021 0489基于增强上下文信息长短期记忆网络的弹道轨迹预测任济寰,吴祥,薄煜明,吴盘龙,何山(南京理工大学 自动化学院,江苏 南京 210094)摘要:根据己方观测数据进行弹道轨迹预测是现代陆军实施精准打击的重要一环。针对现有弹道轨迹预测方法存在精度不足且实时性不强的问题,提出一种新的增强上下文信息长短期记忆(CE-LSTM)网络轨迹预测模型,进行弹道轨迹的长期精准预测。在 LSTM 网络可逼近任意非线性函数且具备长期记忆能力的基础上,构建隐藏层输出混合单元提取短时上下文信息,进一步逼近弹体运动状态;通过建立不同条件下的弹道轨迹的数据集,训练得到具备最优超参数的 CE-LSTM 网络。实验结果表明,与弹道微分方程组的数值积分解法以及高斯混合模型相比,CE-LSTM 网络在预测的精度上优于其他 2 种方法,预测速度提高了 3 10 倍,且具备较强的泛化能力。关键词:轨迹预测;增强上下文信息;长短期记忆网络;弹道微分方程组;高斯混合模型中图分类号:TJ302文献标志码:A文章编号:1000-1093(2023)02-0462-10收稿日期:2022-07-23基金项目:国家自然科学基金项目(62103192);中国博士后科学基金项目(2021M691597);中央高校基本科研业务费专项资金资助项目(30922010710)Ballistic Trajectory Prediction Based on Context-enhancedLong Short-Term Memory NetworkEN Jihuan,WU Xiang,BO Yuming,WU Panlong,HE Shan(School of Automation,Nanjing University of Science and Technology,Nanjing 210094,Jiangsu,China)Abstract:Trajectory prediction based on observed data is critical to the modern army s precision strikecapability Yet,the existing trajectory prediction methods have suffer from low accuracy and poor real-time performance Thus,this study proposes a new model called Context-enhanced Long Short-TermMemory(CE-LSTM)Network to make an accurate long-term prediction of the exterior trajectory ofincoming projectilesThe proposed method inherits the LSTM networks advantage in that it canapproximate any nonlinear function and it has a long-term memory Furthermore,we create a mixtureoutput unit of the hidden layer to extract short-term context information and approximate the motion statesof the incoming projectiles more accurately The CE-LSTM network is trained with a large-scale datasetconsisting of exterior trajectories under different initial conditions to obtain the optimal hyper-parametersThe experimental results show that compared with the methods like external ballistic differential equationsand the Gaussian mixture model,the CE-LSTM network performs significantly better in predictionaccuracy,and its prediction speed increases by three to ten times Moreover,the proposed method ishighly generalizableKeywords:trajectoryprediction;context-enhanced;longshort-termmemorynetwork;ballisticdifferential equations;gaussian mixture model第 2 期基于增强上下文信息长短期记忆网络的弹道轨迹预测0引言根据己方的观测数据进行弹道轨迹预测,是提升现代陆军反应速度和打击精度的重要手段。在陆军的进攻及防御反制措施中,对来袭弹进行拦截时,要求对弹道轨迹进行精准且高效的预测。现役火控系统对弹道预测主要采用解算时间较短的射表函数逼近方法,通过建立运动学或动力学模型,利用函数逼近法等进行轨迹预报1。该方法设计过程繁琐、精度有限,且不同弹种的具体弹道和修正量需要分别解算,不利于火控系统的通用性发展2。为克服上述问题,基于数值积分法求解弹道微分方程组的方法被逐渐应用起来。该方法利用雷达获得来袭弹现在点位置、速度矢量及弹道参数,通过弹道解算来确定炮弹的未来运动轨迹3。弹道方程预测法虽然通用性较好,但需要多次弹道迭代才能得到较高精度的结果,实时性不强。除以上弹道轨迹预测方法外,考虑到弹道轨迹是时序数据,可采用时序预测的方法对雷达采样数据进行处理、分析并进行预测。近年来,在机器学习领域涌现了一批优秀的时序预测方法,其中包括经典结合随机过程的高斯过程回归(GP)4 6 及高斯混合模型(GMM)7。考虑到弹道轨迹是一段复杂的非线性曲线,可将炮弹的轨迹视为一个随机过程,而随机过程可以表达为基于某一核函数的高斯过程(GP)。GP 作为一个特殊的随机过程,它结合了贝叶斯后验概率和核方法,提供了一个有效的概率方法用于回归问题。当 GP 用于处理回归问题时,被称为 GP,而 GMM 使用不同类型的核函数分别做GP 建模,最后对各自输出结果进行加权线性组合,进一步提高了预测精度。GMM 预测法中,核函数直接决定了 GP 的预测精度,它用于捕捉不同输入点之间的关系,从输入的训练数据预测未知点的值。文献 8 使用 GMM,通过所收集的传感器数据和操作监控信息对复杂工业系统组件的剩余寿命进行预测。文献 9 利用 GMM 预测新冠疫情在全球的预期病例、死亡总数、结束日期。GMM 具有容易实现、超参数自适应获取的优点,但其存在因为非参数性质导致计算量大的问题,在面对大数据集时存在应用瓶颈10。近年来,受人脑工作原理启发而设计的神经网络迅猛发展,其旨在模拟人脑的学习过程,实现对信息的智能处理及进一步决策。时序预测是神经网络研究的一个重要领域,在处理时序信息的过程中,记忆是学习的核心环节。卷积神经网络(CNN)11 主要具有空间记忆能力。文献 12 使用 CNN 对飞机的三维飞行轨迹进行预测,但受限于 CNN 有限的时序记忆能力,只能将飞行轨迹拆为 3 个坐标轴上的分量分别预测,其应用前景有限。为更 好 地 形 成 时 空 记 忆,循 环 神 经 网 络(NN)13 通过隐状态传递时序信息。NN 中每个隐状态都会在下一时刻被更新,对短期内的信息更为敏感。在一些复杂场景,如军用、战场等环境中,往往需要处理较大规模的时序数据,要求神经网络必须具备长期记忆能力,NN 就显得力不从心。同时,NN 还存在难以训练、收敛速度缓慢,并时常伴有致命的梯度消失与梯度爆炸等问题。长短期记忆(LSTM)网络14 16 克服了传统 NN 网络存在的大部分问题,能够从时空特征中提取出有效的信息。文献 17提出使用 LSTM 网络对战场目标进行建模,通过对其轨迹的预测来感知和预测战场态势,体现出了 LSTM 网络在时序数据处理领域的优势。但目前将 LSTM 网络用于炮弹轨迹预测在国内外公开发表的文献中未见报道。针对弹道轨迹预测问题,本文提出了上下文增强的长短期记忆(CE-LSTM)网络,进一步加强短期时序特征之间的关联性,以模拟炮弹在飞行过程中的运动状态。用实际弹丸参数建立包含13 500 条不同口径及气象条件的弹道轨迹样本数据集,以保证仿真结果的真实性。利用数据集中样本的最后 20 s轨迹的空间坐标,对 CE-LSTM 网络进行训练、验证及测试。通过对比外弹道数值解法及 GMM 等方法,表明 CE-LSTM 网络在有效保证实时性的同时提高了预测精度。1CE-LSTM 网络轨迹预测模型1.1LSTM 网络简介LSTM 网络是一种应用在深度学习特殊领域中的循环神经网络,它克服了 NN 训练过程中的梯度爆炸和梯度消失问题,并针对短期记忆的问题进行了优化,能够建立较长距离的时间依赖关系,在1997 年由 Sepp 等首次提出18。LSTM 网络的核心在于引入了用于循环传递信息的 LSTM 单元(LSTMCell),能够建立有效的时序依赖关系,适用于军用场景中复杂时序数据的处理。同时,它也通过LSTM 单元缓解了 NN 训练过程中存在的梯度爆炸和梯度消失等问题。LSTM 单元通过设计遗忘门、输入门和输出门364兵工学报第 44 卷这样 3 个门控机制,对网络内记忆信息的流动及其路径进行控制和保护。LSTM 单元的结构如图 1 所示。图 1 中:Xt为 t 时刻网络的输入;ft为 t 时刻遗忘门的输出;it为 t 时刻输入门的输出;ot为 t 时刻输出门的输出;Ct为 t 时刻 LSTM 单元的状态;槇Ct为t 时刻 LSTM 单元的备选状态;ht为 t 时刻隐藏层的输出,即 t 时刻该单元的输出;Ct 1和 ht 1分别表示t 1 时刻 LSTM 单元的状态以及隐藏层的输出;为 sigmoid 激活函数,可将输入数据光滑的压缩并映射到(0,1)区间;tanh 为双曲正切激活函数,可将输入数据光滑的压缩并映射到(1,1)区间。通过这些激活函数及相应的运算得到(0,1)区间内的取值,从而控制 3 个门的开关程度。图 1LSTM 单元Fig 1LSTM unitLSTM 单元中门控单元的工作机制和流程依次为:遗忘门以 Xt和 ht 1为输入,经 sigmoid 函数压缩至(0,1)区间后与 Ct 1数乘,其中 1 表示全部保留,0 表示全部丢弃,从而决定将要从 Ct 1中丢弃哪些信息,其表达式如下:ft=(Wf ht 1,Xt+bf)(1)式中:Wf、bf分别为遗忘门的权值与线性偏置。并非所有的新信息都会被存入 Ct,输入门的输入与遗忘门相同,其作用是过滤。输入门决定了哪些新信息可以存入 Ct,其表达式如下:it=(Wi ht 1,Xt+bi)(2)槇Ct=tanh(Wc ht 1,Xt+bc)(3)式中:Wi、bi分别为输入门的权值与线性偏置;Wc、bc分别为 LSTM 单元的权值与线性偏置。现在结合遗忘门的输出 ft与备选信息槇Ct以及输入门的输出 it对 Ct进行更新,Ct包含了截止至当前时刻的所有历史记忆,其表达式如下:Ct=ft Ct 1+it槇Ct(4)最后由输出门对网络单元最终的输出进行控制,其表达式如下:ot=(Wo ht 1,Xt+bo)(5)ht=ot tanh(