第47卷第6期2022年12月广西大学学报(自然科学版)JournalofGuangxiUniversity(NaturalScienceEdition)Vol.47No.6Dec.2022收稿日期:2022-06-30;修订日期:2022-08-06基金资助:国家自然科学基金项目(62162003,61762008);国家重点研发计划课题(2018YFB1404404)通讯作者:陈宁江(1975—),男,广西南宁人,广西大学教授,博士生导师,博士;E-mail:chnj@gxu.edu.cn。引文格式:刘雨晖,陈宁江,何子琦.云边协同下基于多智能体强化学习的任务卸载策略[J].广西大学学报(自然科学版),2022,47(6):1563-1574.DOI:10.13624/j.cnki.issn.1001-7445.2022.1563云边协同下基于多智能体强化学习的任务卸载策略刘雨晖1,陈宁江1,2,3*,何子琦1(1.广西大学计算机与电子信息学院,广西南宁530004;2.广西智能数字服务工程技术研究中心,广西南宁530004;3.广西高校并行分布与智能计算重点实验室,广西南宁530004)摘要:针对智能移动终端设备的资源有限性和未来网络架构需要云边协同能力等问题,提出了一种基于多智能体强化学习的任务卸载策略,通过部署Cybertwin智能体为用户设备所需卸载的任务合理分配资源,在保证终端设备的服务质量(QoS)要求的同时,最小化整个计算网络的总成本。首先联合设计Cybertwin智能服务代理、计算任务分配以及网络通信与算力等多维异构资源配置构建随机对策的马尔可夫博弈过程(MGP),使执行总延迟和总能耗之和最小。其次考虑到需要处理随机时变网络与动态资源请求的高维连续动作空间,采用了一种基于多智能体双延迟深度确定策略梯度(MATD3)的深度强化学习协同框架求解。仿真实验结果表明:与常见的单智能体学习算法和启发式方案相比,本文提出的MATD3方法具有较好的性能,在平均执行成本方面分别降低了25.61%和35.79%,在任务卸载率上分别提高了39.13%和77.76%。关键词:云边协同;多智能体强化学习;任务卸载;资源分配中图分类号:TP393文献标识码:A文章编号:1001-7445(2022)06-1563-12Taskoffloadingstrategybas...