基于
神经网络
行驶
预测
朝阳
文章编号:1000-5641(2023)02-0106-13基于神经网络的行驶时长预测武朝阳,毛嘉莉(华东师范大学 数据科学与工程学院,上海200062)摘要:定位设备的普及产生了海量的车辆行驶数据,使得利用历史数据预测车辆行驶时长成为可能.车辆行驶数据由两部分组成:车辆行驶经过的路段序列信息和出发时段;路径总长度等外部信息.如何提取路段序列特征,以及如何将序列特征与外部特征有效地融合,成为预测行驶时间的关键问题.为解决以上问题,提出了一个基于 Transformer 的行驶时间预测模型,模型由路段序列处理模块和特征融合模块两部分组成.首先,路段序列处理模块使用自注意力机制处理路段序列,提取路段序列特征.该模型不但可以充分考虑各条路段与其他路段间道路速度的时空关联性,同时可保证数据并行输入模型,避免了使用循环神经网络时数据顺序输入导致的效率低下.其次,特征融合模块将路段序列特征与出发时段等外部信息相融合,最终获得预测的行驶时长.在此基础上,统计路口连接的路段数作为路段的上/下游路口特征,与路段特征结合输入模型,进一步提升了行驶时长的预测精度.在真实的数据集上与主流预测模型进行的对比实验表明,该模型在预测精度以及训练速度上均有提升,体现了所提模型的有效性.关键词:行驶时长预测;位置服务;注意力机制;时空数据中图分类号:TP311文献标志码:ADOI:10.3969/j.issn.1000-5641.2023.02.012Research on travel time prediction based on neural networkWU Zhaoyang,MAO Jiali(School of Data Science and Engineering,East China Normal University,Shanghai200062,China)Abstract:The popularity of positioning devices has generated a large volume of vehicle driving data,making it possible to use historical data to predict the driving time of vehicles.Vehicle driving dataconsists of two parts:the sequence of road segments that the vehicle travels through,the departure time,the total length of the path,and other external information.The questions of how to extract sequencefeatures in road segments and how to effectively fuse sequence features with external features become thekey issues in predicting the travel time.To solve the aforementioned problems,a transformer-based traveltime prediction model is proposed,which consists of two parts:a road segment sequence processing moduleand a feature fusion module.First,the road segment sequence processing module uses the self-attentionmechanism to process the road segment sequence and extract the road segment sequence features.Themodel can not only fully consider the spatiotemporal correlation of road speeds between each road segmentand other road segments,but also ensures the parallel input of data into the model,avoiding the lowefficiency problem caused by sequential input of data when using recurrent neural networks.The featurefusion module fuses the road segment sequence features with external information,such as departure time,and obtains the predicted travel time.On this basis,the number of road segments connected by theintersection is determined by the upstream and downstream intersection features of the road segment,and 收稿日期:2021-12-03基金项目:国家自然科学基金(62072180)通信作者:毛嘉莉,女,教授,博士生导师,研究方向为时空数据管理与分析.E-mail: 第 2 期华东师范大学学报(自然科学版)No.22023 年 3 月Journal of East China Normal University(Natural Science)Mar.2023the input model is combined with the road segment characteristics to further improve the predictionaccuracy of the driving time.Comparative experiments with mainstream prediction methods on real datasets show that the model improves prediction accuracy and training speed,reflecting the effectiveness of theproposed method.Keywords:travel time predition;location-based services;attention mechanism;spatial-temporal data 0 引言行驶时长预测是智慧交通与物流系统中的核心功能,被广泛地运用于地图导航、网约车派单以及外卖送餐等应用中.近年来,人们出行的线路规划已高度依赖时长预测.如图 1 所示,预测行驶时长可以方便出行者选择出行线路,有利于提升他们的出行体验.可以将行驶时长预测问题视为一个回归问题,即给定车辆行驶的起点、终点和预计行驶通过的路径,结合车辆的出发时间、司机、天气等信息,预测车辆到达终点所需的行驶时长.图 1 线路规划中的行驶时长预测Fig.1 Illustration of travel time prediction for route planning ht1tht行驶时长预测问题作为时空数据领域的经典问题,受到了来自学术界、工业界的广泛关注,结合机器学习、深度学习技术的大量预测模型因此被提出.在现有方法中,基于神经网络的预测模型的精度高于基于传统机器学习的方法.而基于深度学习的预测模型,大多1-2使用循环神经网络来处理路段序列,进而提取路段间影响道路速度的时空特征.循环神经网络模型需要根据上一状态 和当前位置 的输入来输出当前状态 ,它要求数据依次顺序地输入,这使得循环神经网络不能并行计算,导致执行过程中训练推断时间较长.目前,基于 Transformer 结构的模型已成功地应用于自然语言处理3、计算机视觉4、图结构表示5、推荐系统6等多个领域,并取得了较好效能.Transformer 中的注意力机制不仅能获取距离较远的输入间的影响关系,还可以并行地处理输入数据,对于输入序列无前后位置的严格要求.因此,本文引入 Transformer 来解决车辆的行驶时长预测问题.除了考虑路段自身的特征(交通状况、历史平均通行时长等)外,本文还结合了道路间的上/下游路口特征,即路段上/下游路口分别连接的路段个数.基于真实数据集的实验证明,本文提出的结合上/下游路口特征的预测模型能显著提升车辆行驶时长的预测精度.本文的贡献包括以下 3 点.(1)为解决使用循环神经网络时数据依次输入模型导致的训练推断低速的问题,基于 Transformer结构设计了 Linkformer 模型.通过 Transformer 的注意力机制,所有路段向量可确保并行输入模型,第 2 期武朝阳,等:基于神经网络的行驶时长预测107避免了训练推断低效的问题.(2)通过在预测模型中结合路段间提取的上/下游路口特征,在提取较远距离路段间道路速度的关联性的同时,引入路段两端的路口信息,进一步提升了行驶时长的预测精度.(3)通过在真实数据集上与主流预测模型的对比实验,验证了本文模型不仅能提升模型训练推断效率,还能获得较高的预测精度.1 相关工作行驶时长预测模型大致可分为两类:基于起点/终点信息的预测方法(origin-destination basedmethod)和基于路径信息的预测方法(path-based method).基于起点/终点信息的预测方法在预测车辆的行驶时长时,需给定车辆的当前位置和终点位置.基于路径信息的预测方法在预测行驶时长时,需给定由路径规划系统获得的车辆行驶轨迹.1.1基于起点/终点信息的预测方法Wang 等7提出的 TEMP(temporally weighted neighbors)方法,首先从历史轨迹中找出与目标起点/终点位置距离较近的轨迹数据,再结合车辆的出发时间,将历史轨迹的行驶时长进行统计后获得其均值,以此均值作为预测的行驶时长.Jindal 等8提出了两阶段的 ST-NN(spatio-temporal neuralnetwork)模型,先根据起点/终点的经纬度坐标信息,采用多层感知机预测其总行驶里程,再结合车辆的出发时间,利用神经网络模型预测总的行驶时长.Li 等9提出了 MURAT(multi-task representationlearning model for arrival time estimation)模型,该模型是一个表征学习框架,通过预测行驶时长任务,获得路段、时段等特征的表示,并使用多任务学习方法进一步提升行驶时长的预测精度.由于缺乏车辆行驶路径这一重要信息,基于起点/终点信息的预测方法其精度普遍低于结合路径信息的预测方法.Ounoughi 等10提出的 ZED-TTE(zone embedding and deep neural network-based TTE(traveltime estimation)模型,将路网按时空特性分成了几个区域,起点/终点在输入模型时转化为起点区域向量和终点区域向量,提升了模型的泛化能力.1.2基于路径信息的预测方法此类早期的预测方法是基于线圈传感器采集的数据11-14或者浮动车的轨迹数据15-17统计得到每个路段的历史平均通行时间,然后将各段的通行时间进行累加得到行驶时长.该类方法的缺陷是没有考虑车辆在路段与路段之间所耗费的时长,如车辆等候红绿灯的时间、车辆在路口转向所用的时间等.随着手机等定位设备的普及,持续产生了大规模的时空轨迹数据.越来越多的模型