引用格式:唐嘉宁,杨昕,周思达,等.未知环境下改进DDQN的无人机探索航迹规划研究[J].电光与控制,2023,30(4):23⁃27'33.TANGJN'YANGX'ZHOUSD'etal.UAVexplorationtrajectoryplanningwithimprovedDDQNinunknownenvironment[J].ElectronicsOptics&Control'2023'30(4):23⁃27'33.未知环境下改进DDQN的无人机探索航迹规划研究唐嘉宁,杨昕,周思达,李罗宇,安城安(云南民族大学电气信息工程学院,昆明650000)摘要:对未知环境的探索,如搜救、追逃等场景,无人机需要一边探索(感知)环境一边完成当前的航迹规划(动作选择)。针对上述场景,为了提高无人机对未知环境的探索范围,提出了结合长短期记忆的改进深度双Q网络探索航迹规划方法:搭建仿真地图,以无人机视野内的环境信息作为输入,引入长短期记忆网络,输出动作方向的选择;设置探索经验样本优先级,提高训练效率;加入飞行动力学约束,设计合理的状态、动作空间及单步奖励函数。运用所提算法,无人机可以自主规划出一条无碰撞且对环境探索范围大的航迹。仿真实验结果表明:在未知环境下,所提算法得到的探索面积比、单步探索平均奖励值等指标均优于传统的DDQN算法。关键词:无人机;长短期记忆网络;深度双Q网络;未知环境探索;航迹规划中图分类号:V249文献标志码:Adoi:10.3969/j.issn.1671-637X.2023.04.005UAVExplorationTrajectoryPlanningwithImprovedDDQNinUnknownEnvironmentTANGJianing'YANGXin'ZHOUSida'LILuoyu'ANCheng'an(AcademyofElectricalInformationEngineering'YunnanMinzuUniversity'Kunming650000'China)Abstract:Fortheexplorationofunknownenvironments'suchassearchandrescue'chaseandescapescenarios'theUAVneedstoexplore(perceive)theenvironmentwhilecom...