第42卷第6期2022年12月弹箭与制导学报JournalofProjectiles,Rockets,MissilesandGuidanceVol.42No.6Dec.2022DOI:10.15892/j.cnki.djzdxb.2022.06.007收稿日期:2022-09-24作者简介:成旭明(1998—),男,江苏盐城人,硕士研究生,研究方向:无人机自主规划与控制。基于IMM⁃PPO的无人机机动目标追踪成旭明,丛玉华,欧阳权,王志胜(南京航空航天大学自动化学院,南京210016)摘要:针对无人机在复杂障碍物环境下追踪机动目标的问题,提出了一种基于IMM⁃PPO的导航跟踪策略,估计多模型混合的机动目标状态信息,设计基于目标跟踪性能、追踪逼近时间以及障碍物约束的奖惩函数,并在Actor⁃Critic网络结构下设计近端策略优化的算法框架,通过智能体与环境交互,训练出奖励最大化下的网络参数。训练后的决策网络能够根据环境信息完成避障导航并实现对机动目标的稳定跟踪。仿真结果表明,相比于传统避障跟踪算法,基于IMM⁃PPO的导航跟踪策略具有更好的跟踪性能、更快的追踪速度以及更短的避障导航路径,且在初始条件改变的情况下仍具有一定的自主追踪能力,在应用于无人机机动目标追踪任务中时具备更大的优势。关键词:强化学习;多旋翼无人机;目标跟踪;路径规划中图分类号:TP181文献标志码:AUAVManeuveringTargetTrackingbasedonIMM⁃PPOCHENGXuming,CONGYuhua,OUYANGQuan,WANGZhisheng(CollegeofAutomationEngineering,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China)Abstract:FocusingontheproblemofUAVmaneuveringtargettrackingincomplexobstacleenvironment,thispaperproposesanavigationandtrackingstrategybasedonIMM⁃PPO.Thestateinformationofmaneuveringtargetswithmultiplemodelsisesti⁃mated,ar...