第42卷第6期2022年12月弹箭与制导学报JournalofProjectiles,Rockets,MissilesandGuidanceVol.42No.6Dec.2022DOI:10.15892/j.cnki.djzdxb.2022.06.009收稿日期:2022-09-24作者简介:费陈(1994—),男,安徽芜湖人,硕士,研究方向:机器学习及强化学习、无人机应用。基于强化学习的无人机智能任务分配方法费陈,郑晗,赵亮(武警士官学校基础部,杭州311400)摘要:针对无人机群目标打击任务分配问题,提出一种基于强化学习的无人机智能任务分配方法。该方法提出一种任务分层框架,将多个无人机视为一个联盟并对目标进行分类,形成任务簇,并映射到无人机联盟中,通过多智能体强化学习算法(MADDPG)将任务簇内的目标与无人机联盟内的小无人机进行合理配对并对目标实施打击,得到MAD⁃DPG算法的回报值和飞行轨迹,并与DDPG算法、DQN算法的回报值和飞行轨迹进行对比。仿真结果表明,在小样本任务分配中,与不分层方法相比,该方法可以提高目标任务打击完成度,提升目标打击的效率;在分层框架下,相比于其他两种算法,收敛速度更快,收敛过程更加稳定。关键词:任务分层框架;多智能体强化学习;无人机联盟;任务分配;目标打击中图分类号:TP301.6文献标志码:AReinforcementLearning⁃basedIntelligentTaskAssignmentMethodforUnmannedAerialVehiclesFEIChen,ZHENGHan,ZHAOLiang(BasicDepartment,ArmedPoliceOfficerSchool,Hangzhou311400,China)Abstract:AimingatthetaskassignmentproblemofUAVswarmtargetstrike,thispaperproposesanintelligentUAVtaskas⁃signmentmethodbasedonreinforcementlearning.Thisstrategyproposesatasklayeringframework,whichtreatsmultipleUAVsasanallianceandclassifiesthetargetstoform...