总第341期1引言近年来,利用全球卫星导航系统(GlobalNavi⁃gationSatelliteSystem,GNSS)的雷达标校技术逐渐成为主要方式,通过在远距离释放携带GNSS接收机的无人机,以及舰上安装的GNSS接收机,将两个接收机的经纬度、海拔数据转化为方位距离仰角,再经过位置间隔修正到雷达所在位置,比较雷达读数和修正后的方位距离仰角,分析其误差。由于GNSS的定位精度可以达到厘米级,因此标校精度可以达到0.01°,成为了现在标校的主要技术。然而在动态测量中我们发现,由于船舶的摇摆及无人机的位置变化,以及GNSS信号的波动,在测量过程中可能会出现部分数据精度不足的问题,严重影响了标校结果。因此,本文提出一种基于GNSS数据优化改进方位距离仰角测向定位的方法,具体来说,我们开发了一个强化学习模型来实现修正双GNSS相对位置计算的最优策略。为了加速训练过程并获得更好的性能,实现了一种最先进的并行训练架构,即异步优势参与者-批评(A3C)∗收稿日期:2022年5月19日,修回日期:2022年6月18日作者简介:刘佳铭,男,工程师,研究方向:船舶设计建造。段静玄,男,博士,高级工程师,研究方向:作战系统对准。张学良,男,工程师,研究方向:作战系统对准。林静,女,工程师,研究方向:作战系统对准。基于强化学习提升双GNSS测向精度方法研究∗刘佳铭1段静玄2张学良2林静2(1.海装上海局驻上海地区第五代表室上海200135)(2.中国舰船研究设计中心武汉430064)摘要GNSS测量精度是准确标校雷达的基础,为了提高GNSS定位精度构建了强化学习框架来,该框架无需对GNSS设备硬件参数或运动模型做出严格的假设,自动寻优最佳策略来实现原始GNSS观测的“校正”。强化学习模型使用了一种有效的基于置信度的奖励机制,该机制独立于地理位置,从而使模型具有泛化性。通过与扩展卡尔曼滤波器算法进行比较来评估模型的性能。实验表明,与基准扩展卡尔曼滤波器模型相比,所提出的强化学习模型收敛速度快,预测方差较小,并且可以将测向定位误差减少50%。关键词雷达标校;无人机;双GNSS;测向;强化学习中图分类号TN958DOI:10.3969/j.issn.1672-9730.2022.11.014ResearchonImprovingDirectionFindingAccuracyofDoubleGNSSBasedonReinforcementLearningLIUJiaming1DUANJingxuan2ZHANGXueliang2LINJing2(1.TheFifthNavalMilitaryRepresentativeOfficeofShanghaiBureauofNavalEquipmentDepartmentinShanghai,Shanghai200135)(2.ChinaShipDevelopmentandDe...