基于
多层
卷积
长短
记忆
神经网络
路网
客流
预测
研究
运营管理基于多层卷积长短期记忆神经网络的城轨路网短时客流预测研究王忻,李哗,张思韬,张凌云(铁科院(北京)工程咨询有限公司,北京1 0 0 0 8 1)摘要:精准的客流预测对城市轨道交通管理者获取交通需求变化、做出科学决策具有重要意义。为进一步提升客流预测精度,充分考虑客流时空特性,文章提出一种基于多层卷积长短期记忆神经网络(ConvLSTM)的路网短时客流预测模型。通过多层ConvLSTM中的卷积运算获取客流的空间特性,通过长短期记忆部分获取客流的时间特性。为验证模型的有效性,采用某城市地铁客流数据进行案例验证,研究结果表明:该模型相比于现有模型具有更高的预测精度。综上所述,该模型可为城市轨道交通站点短时客流预测提供新的方法,具有研究意义和现实意义。关键词:城市轨道交通;短时客流;预测;ConvLSTM中图分类号:U2311背景我国城市化正进入高速发展时期,越来越多的城市建立了城市轨道交通系统,并且城市轨道交通在公共交通中的作用越来越显著,“智慧化”成为城市轨道交通未来的发展趋势。而精准的客流预测是建设智慧化城市轨道交通的重要前提,能实现高峰客流的提前感知,可为运营期间进行动态运力调整提供数据基础,进而为城市轨道交通的安全高效运营提供保障2 1。目前,短时客流预测主要基于2 类模型:传统统计模型和机器学习模型。传统统计模型从机理上对线性系统进行刻画,具有原理简单、方便计算等优点。蔡昌俊等构建差分整合移动平均自回归模型(ARIMA)实现进出站客流的精准预测1 3。邵必林等在ARIMA模型的基础上应用季节移动平均自回归模型(SARIMA)实现客流数据线性建模!。帅春燕等基于支持向量回归模型实现站点短时进出站客流预测5。但传统数理统计模型存在对实际问题进行简化和假设的问题,对于地铁时序客流重的非线性特征难以刻画,导致预测精度不高。因此,随着计算机技术的发展,基于机器学习模型的预测算法成为目前较为流行的客流预测算法,对于交通客流复杂时空特征具有较好的捕获效果7。魏姝瑶等将长短期记忆神经网络(LSMT)与传统统计模型结合提出SARIMA-LSTM模型8,但是该模型缺少对空间特征的刻画。Cao等利用卷积神经网络(CNN)提取空间特征提升了预测效果9,但对时间特征刻画不足。唐继强等利用图卷积结合LSTM进行预测网络搭建,同时考虑了客流的时空特征1 0,但仅为图卷积模块和LSTM模块的拼接,并没实现模型的深度融合。由于城市轨道交通进出站客流是一个复杂的非线性系统,在时间维度上存在短期波动性以及长期的周期性,同时在空间上由于站点之间的相关性导致站点客流与站点客流之间具有复杂的空间相关性。目前研究忽略了客流之间的相互影响,缺少对站点短时客流之间的时空关系深人挖掘,无法实现时空特征的深度融合,导致目前短期客流预测存在精度不高的问题。综上所述,本文提出一种基于多层卷积长短期记忆基金项目:铁科院(北京)工程咨询有限公司基金项目(2 0 2 1 ZXJ002)第一作者:王忻,男,副研究员现代城市轨道交通91 2 0 2 3MODERNURBANTRANST95运营管理基于多层卷积长短期记忆神经网络的城轨路网短时客流预测研究神经网络(ConvLSTM)的城市轨道交通短时客流预测模型,充分考虑时序客流的时间特征和站点与站点间的空间特征,实现了时间特征和空间特征的刻画和融合,相比于现有模型具有更好预测效果。2模型描述2.1卷积长短期记忆神经网络LSTM是循环神经网络(RNN)的变体,是处理时间序列预测问题的常用机器学习方法,解决了RNN因为梯度爆炸和梯度消失导致的无法保存长期序列特征的问题,如图1 所示。ConvLSTM将LSTM拓展至二维,将LSTM中的一部分全连接过程替换为卷积运算,强化了LSTM无法刻画的空间特征,可处理多维数据的时序预测问题2 1,如图2 所示。ConvLSMT的计算原理类似于LSTM,具有3种类型的门结构:遗忘门、输人门和输出门。遗忘门决定应丢弃或保留哪些信息,控制前一个隐藏状态的信息和当前输人信息传递的保留程度,如式(1)所示:fi=o(W,*X,+W,*H-I+W,oCi-I+b,)式(1)中,f为遗忘门,控制过去输人信息累积;为sigmoid激活函数;X,为时间t的输人矩阵序列;W,为输入序列的卷积权重;H,-为前一时刻隐藏状态单元;W,为隐藏单元的卷积权重;Ci-1为前一时刻神经元状态单元;W,为遗忘门卷积权重;br为遗忘门偏置;*为卷积运算;为哈达玛积运算。输入门用于决定输人神经元状态的信息,控制前一层隐藏状态的信息和当前输人的信息传递后的信息更新程度,如式(2)所示:i=o(W,*X,+W,*H-I+W,oC(-I+b,)式(2)中,为输入门,控制当前输入信息保留多少;W为输门卷积权重;b,为输入门偏置。输出门用来确定下一个隐藏状态的值,隐藏状态包含了先前输人的信息,如式(3)所示:0,=(W,*X,+W,*H-I+W,oC-I+b)式(3)中,0,为输出门,控制当前状态有多少信息对外可见;W。为输出门卷积权重;b。为输出门偏置。最后隐藏状态和神经元状态计算如式(4)式(6)H,LSMTCi-1H-1注:图中相关参数涵义可参照后文公式(1)公式(6)中相关参数释义。图1 长短期记忆神经网络结构H,ConvLSMTCi-1WH,-1BNBN(1)Xi-1注:BN为归一化处理;其余参数涵义可参照后文公式(1)公式(6)中相关参数释义。图2 卷积长短期记忆神经网络结构所示:C,=f,oCI+i,oc,C,=tanh(W,*X,+W,*H-+b.)H,=o,otanh(C,)式(4)式(6)中,C,为神经元状态;,为临时单元;(2)b。为残差;H-和H,分别为前一时刻隐藏状态和当前时刻隐藏状态单元。2.2基于多层ConvLSTM的短时预测模型本文提出基于多层ConvLSTM的短时预测模型(M-C o n v LST M),通过ConvLSTM中的卷积操作获取站(3)点间客流的空间特征以及LSTM机制捕获时序客流的时间特征,实现对下一时间间隔内的路网客流预测。该方法主要分为2 个部分:第1 部分通过多层ConvLSTM捕获路网客流的时空特征;第2 部分引入二维卷积对空间?C,tanhC,tanhXi-1CtanhWHCBNW.tanh0,H,(4)(5)(6)96MODERNURBANTRANSIT912023现代城市轨道交通基于多层卷积长短期记忆神经网络的城轨路网短时客流预测研究运营管理特征进一步强化,如图3所示。其中,ConvLSTM3110代表该层采用1 0 个大小为31 的卷积核的卷积长短期记忆层,Conv2D310代表该层采用31 0 的卷积核的卷积层,BN+ReLU为激活层及线性整流。模型输人为前序的路网进出站量序ConvLSMTBN+3X1X10ReLUConvLSMTBN+31X10ReLU输人序列ConvLSMT3X1X10ReLU图3多层ConvLSTM短时预测模型03691215-182103-69121518-21列P,输出为预测的路网进出站量p:P,=Conv2D(M-ConvLSTM(P,)式(7)中,Conv2D为二维卷积;M-ConvLSTM为多层ConvLSTM。3案例分析3.1数据来源某城市地铁路网共设2 3座车站,运营时间Conv2D为早6:0 0 一2 2:0 0。选用城市2 0 2 1 年6 月至1 23X10月共7 个月的进出站数据,在进行配对分析之后,Conv2D得到了相应的断面流量数据,将工作日与周末、3X10BN+07:4509:4511:4513:4515:4517:4519:4521:45时间a工作日上行07:4509:4511:4513:4515:4517:4519:4521:45时间工作日下行(7)预测结果法定节假日等分别统计,得到4个图像,分别对应工作日上行、工作日下行、节假日上行、节假日下行。每张图片中横轴代表时间,纵轴代表区间断面,如图4所示。该线路客流在工作日呈现0369-1215182103-6-912-151821图4不同时间上下行客流热度图07:4509:4511:4513:4515:4517:4519:4521:45b节假日上行07:4509:4511:4513:4515:4517:4519:4521:45时间d节假日下行时间现代城市轨道交通9/2023MODERNURBANTRANSIT97运营管理基于多层卷积长短期记忆神经网络的城轨路网短时客流预测研究明显的早晚双高峰,分别在7:30 和1 8:0 0 前后;同时,上下行呈现明显的对称分布,早晨上行与晚上下行在区间和客流密度上都呈现出很大的相似性,与工作日一般客流特点一致。节假日客流整体上大于工作日客流,也呈现了一定的早晚高峰现象,但是其分布更加分散,在全天均有相对高的客流,并且对称性不如工作日明显。本文采用其2 0 2 1 年8 月至9月去除周末及节假日共44天的30 min粒度自动售票系统(AFC)数据进行案例分析,其中前2 6 天为训练集,之后9天为验证集,最后9天为测试集。3.2实验结果本文选用平均绝对误差(MAE)、均方根误差(R M SE)和平均绝对百分比误差(WMAPE)作为评价指标对预测精度进行评价,如式(8)式(1 0)所示:MAE=-21yi-y9l1ni-12(y-y9)2RMSE=11=11WMAPE=i=1式(8)式(1 0)中,为预测值;为真实值;n为样本数量。为评价本文M-ConvLSTM模型预测效果,选用多个模型进行对照分析,包括:支持向量回归(SVR)13)、LSTM和ConvLSTM,对下一时段路网进站量预测结果如表1 所示。表1 各各模型预测结果对比模型MAESVR93.46LSTM56.62ConvLSTM31.96M-ConvLSTM25.98由表可知,本文模型在各项评估指标均优于基准模型,对比SVR、LST M 和ConvLSTM本文模型在MAE上提升了7 2.2%、54.1%和1 8.7%。通过WMAPE指标可看出本文模型相比基准模型分别提升了39.99%、98MMODERNURBANTRANSIT912023现代城市轨道交通26.65%和5.6 8%的预测准确率。说明本文提出的M-ConvLSTM模型在预测过程中充分捕获了客流数据间的时空特征,具有良好的预测精度。为直观观察算法预测效果,以路网中某站为例绘制进站量时序图,如图5所示。可观察到本文模型预测结果与实际值高度吻合,预测值在时序上呈双峰特征,与现实物理世界规律一致,且不仅在峰值时段具有较好的拟合效果,在非高峰时段的低谷时段对波动客流量的预测效果也同样良好,说明本文模型在时间上具有较强的时间特征捕获能力。300250200(8)15010050(9)n(10)RMSEWMAPE/%146.0257.3986.4344.0551.5123.0845.0217.40一真实值M-ConvLSTM00图5M-ConvLSTM预测结果与真实值对比同时,进一步观察各个站点的预测WMAPE,如图6所示。可观察到本文模型在大部分站点的WMAPE值较低,且在各站点的预测准确率均高于基准模型,对于所有类型的站点均有较好的预测精度,说明本文模型通过卷积操作,挖掘到不同站点间的空间关系,在空间上具有较强的空间特征捕获能力。1.0-M-ConvLSTM-LSTMConvLSTM0.80.60.40.20图6 各站点预测误差分布505100时段/1 5min10站点序号1502001525020基于多层卷积长短期记忆神经网络的城轨路网短时客流预测研究运营管理9 M.Cao,V.Li,V.Chan.A CNN-LSTM Model for4结论Traffic Speed PredictionC/2020 IEEE 91st Vehicular本文针对城市轨道交通路网短时客流预测问题,TechnologyConference(VTC2020-Spring),2020:构建了基于多层ConvLSTM的短时预测模型,通过1-5.ConvLSTM中的卷积操作获取站点间客流的空间特征以10唐继强,杨璐琦,杨武.融合长短期记忆网络和图及LSTM机制捕获时序客流的时间特征。在某城市地铁卷积网络的轨道交通短时客流起点预测J.重庆数据集上进行案例验证以及分析,结果表明本文模型在大学学报,2 0 2 2,45(1 1):91-99.预测精度上具有较好效果,能够充分捕获路网客流的时11杨丽,吴雨茜,王俊丽,等.循环神经网络研究综空特征。述.计算机应用,2 0 1 8,38(S2):1-6,2 6.精准的客流预测能够及时有效地预测未来路网信12李莎,王秋雯,陈彦如,等.基于SAE-ConvLSTM息,帮助运营部门提前感知高峰客流,为运力的动态调深度学习模型的多站城轨短时客流预测J.计算机整提供数据基础,具有较高的研究价值和应用价值。未应用研究,2 0 2 2,39(7):2 0 2 5-2 0 31.来研究可引入外部因素如天气、突发事件等信息,进一13郭淼.基于支持向量回归的大型客运站客流量预测步提升模型的泛用性和预测精度。应用研究.铁路计算机应用,2 0 2 1,30(3):1 5-1 8.参考文献收稿日期2 0 2 3-0 3-0 31许心越,吴宇航,张英男,等.考虑时空修正的轨责任编辑胡姬道交通封站短时客流预测方法J.交通运输工程学报,2 0 2 1,2 1(5):2 51-2 6 4.2】梁强升,许心越,刘利强.面向数据驱动的城市轨道交通短时客流预测模型.中国铁道科学,2 0 2 0,41(4):153-162.3蔡昌俊,姚恩建,王梅英,等.基于乘积ARIMA模型的城市轨道交通进出站客流量预测.北京交通大学学报,2 0 1 4,38(2):1 35-1 40.4邵必林,饶媛,何欣.基于SARIMA-SVM组合模型的地铁客流量预测研究J.软件导刊,2 0 2 2,2 1(11):24-30.5】帅春燕,谢亚威,单君等.基于SSA-SVR模型的城市轨道交通短时进站客流预测.都市快轨交通,2022,35(5):7 6-8 3.6施俊庆,李睿,程明慧,等.基于动态时空神经网络模型的地铁客流预测J.交通运输系统工程与信息,2 0 2 3,2 3(2):1 39-1 47.7】王雪琴,许心越,伍元凯,等.基于混合深度学习模型的城轨短时客流预测.铁道科学与工程学报,2022,1 9(1 2):3557-356 8.8魏妹瑶,张瑾.SARIMA-LSTM组合模型在铁路疫情短时客流的预测研究J.重庆理工大学学报(自然科学,2 0 2 3,37(3):2 0 4-2 1 1.Research on short-term passenger flow prediction ofurban rail transit based on multilayer convolution longand short-term memoryneural networkWang Xin,Li Ye,Zhang Sitao,et al.Abstract:Accurate passenger flow prediction is of greatsignificance for urban rail transit managers to make scientificdecisions about the changes in traffic demand.In order tofurther improve the accuracy of passenger flow predictionand fully consider the space-time characteristics of passengerflow,a short-term passenger flow prediction model basedon Convolution Long Short-Term Memory(ConvLSTM)is proposed.The spatial characteristics of passenger floware obtained through convolution operations in multi-layerConvLSTM,and the temporal characteristics of passengerflow are obtained through long-term and short-termmemory.In order to verify the effectiveness of the model,a certain city metro data was used for case verification.Theresearch results show that the ConvLSTM model has higherprediction accuracy than the existing models.To sum up,themodel can provide a new method for short-term passengerflow prediction at urban rail transit stations,and has researchand practical significance.Keywords:urban rail transit,short-term passenger,prediction,ConvLSTM现代城市轨道交通91 2 0 2 3MODERNURBANTRANSIT99