ComputerEngineeringandApplications计算机工程与应用2023,59(7)近年来,人们日常出行越来越倾向网约打车,据估计到2025年网约车所带来的经济利益将高达3350亿美元[1]。网约车平台研究的重点之一就是如何从全局上缩短乘客等待网约车的时间,并尽可能地使司机收益最大。设计一种从全局上缩短乘客等待时间的车辆调度算法是具有挑战性的。在大城市中,虽然大部分乘客可以快速地叫到网约车,但仍有很多乘客的订单需要过长的时间来响应。在早期研究工作中,使用贪心算法[2]或是FCFS[3]等算法来估计乘客的等待时间,以此来进行车辆调度,这些算法大都无法适应时空复杂变化的网约车基于局部位置感知的多智能体网约车调度方法黄晓辉,凌嘉壕,张雄,熊李艳,曾辉华东交通大学信息工程学院,南昌330013摘要:近年来,网上约车成为人们日常出行不可或缺的一部分。网约车平台的核心任务是如何有效地把订单派送给合适的司机,使得用户总体等待时间尽可能短,而司机的收益尽可能高。在目前的研究中,主要采用贪心算法以及强化学习来构建模型。但当前方法大都只考虑乘客的即时满意度,未能有效地考虑车辆、订单之间相对位置关系,从长远的角度来降低全体乘客的等待时间。为此,将订单派送构建为一个马尔可夫过程,提出了一种基于局部位置感知的多智能体的车辆调度方法。该方法通过设计合适的输入状态和卷积神经网络来捕捉人与车的时空关系,从长远角度来降低乘客的总体等待时间。实验结果表明,在不同规格的地图、不同数量的车辆和订单的场景中,提出的方法均优于现有的研究方法,并且拥有更好的泛化能力。特别是在大规模人车环境的复杂场景中,该方法所取得的结果要明显优于现有方法。关键词:多智能体强化学习;车辆调度;局部感知;深度强化学习文献标志码:A中图分类号:TP391.9doi:10.3778/j.issn.1002-8331.2111-0490OnlineCar-HailingDispatchMethodBasedonLocalPositionPerceptionMulti-AgentHUANGXiaohui,LINGJiahao,ZHANGXiong,XIONGLiyan,ZENGHuiSchoolofInformationEngineering,EastChinaJiaotongUniversity,Nanchang330013,ChinaAbstract:Inrecentyears,onlinecar-hailinghasbecomeanindispensablepartofpeople’sdailytravel.Thecoretaskoftheonlinecar-hailingplatformishowtoeffectivelydispatchtheordertotheappropriatedriver,sothattheoverallwaitingtimeofusersisasshortaspossible,andthedriver’srevenueisashighaspossible.Inthecurr...