温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
采用
特征
变量
选择
长短
高速
公路交通
事件
检测
研究
()年 第 卷 第 期 收稿日期:基金项目:江西省教育厅一般课题();国家自然科学基金项目();江西省交通运输厅一般课题()作者简介:张兵,男,博士,副教授,主要从事交通安全及交通事件智能检测研究,-:。本文引用格式:张兵,张校梁,屈永强,等 采用特征变量选择和长短期记忆网络的高速公路交通事件检测研究 重庆理工大学学报(自然科学),():,-(),():()采用特征变量选择和长短期记忆网络的高速公路交通事件检测研究张兵,张校梁,屈永强,上官小荣,邹少权(华东交通大学 交通运输工程学院,南昌 ;江西交通职业技术学院,南昌 ;江西省交通规划勘察设计院,南昌 )摘要:为提升高速公路交通事件检测效果,依据交通事件发生时上、下游交通流参数的变化特性,构建一组相对全面的交通事件检测初始特征变量集,使用随机森林 交叉验证递归特征消除(-)算法筛选出重要特征变量。利用重要特征变量作为输入训练长短期记忆网络(),通过贝叶斯优化算法()优化 网络的超参数。使用真实高速公路数据进行验证和对比分析,采用 -解决交通数据集的不平衡问题。实验结果表明:筛选出对交通事件检测更为敏感的重要特征变量,可以提高检测精度,的检测效果也明显优于随机森林()和支持向量机()。关键词:交通事件检测;特征变量选择;贝叶斯优化;长短期记忆网络中图分类号:文献标识码:文章编号:()引言高速公路作为连接城市群的快速公路,在促进城市群内交通运输一体化发展和城乡交通运输一体化发展等方面发挥着重要作用。随着高速公路的快速发展,高速公路的安全形势越来越严峻。据统计,我国约有 交通死亡事件发生在高速公路 ,给人们的生命和财产带来巨大损失。交通事件是指干扰正常交通流并降低道路通行能力的随机性偶发事件,如突发交通事故、车辆故障和不良驾驶行为等,往往难以预判,容易造成交通拥堵,导致局部交通瘫痪,对道路的正常安全行驶产生严重影响。因此,研究先进的交通事件检测算法()能极大地提高公路管理水平,实现高效化应急救援,最大限度地避免发生二次事故,对构建安全、高效的交通运输体系十分重要。交通事件检测算法的原理是根据事件发生地点上下游路段检测器交通流参数数据的变化规律对交通状态进行判别,目前已形成很多较为成熟的算法,从事件检测原理可以将交通事件检测算法分为阈值比较、概率统计、预测回归和机器学习等。比较典型的算法有加州算法 、贝叶斯算法 、卡尔曼滤波算法 、标准偏差算法 和小波分析 等。这类 算法通过比较交通参数实测值与预设阈值的差异大小或依据事件发生的先验概率条件来判断事件发生与否。随着人工智能技术的快速发展,机器学习作为人工智能的核心被人们应用到交通事件检测中,如神经网络 、决策树 和支持向量机()等。这类 算法将交通事件检测视为二元分类问题,通过对分类器进行训练,可以更有效地挖掘交通数据的隐含信息,更具发展前景。深度学习作为机器学习的一个重要分支,已成功应用于有监督 无监督分类和异常检测问题 ,正逐步应用在 算法中,如深度循环极限学习机 和堆叠自编码器 等。但是目前对 算法的研究主要集中在对模型方法的组合、集成和优化上,对交通事件检测的信息构建并不全面,算法的输入变量仅局限为原始交通流基本参数(交通量、速度和占用率),很少考虑特征变量集的构造和对重要变量的筛选,算法性能不高。对于机器学习分类问题,特征变量选择可以去除冗余变量,降低计算复杂度,有效提高分类精度。因此,本文以交通流基本参数和参数间的不同方式进行组合,得到相对全面的初始变量集,并通过随机森林对变量重要性进行分析,再由经过交叉验证的递归特征消除算法()筛选出更为敏感的重要特征变量。以在捕捉时间序列长期依赖性方面具有出色性能的长短期记忆网络()作为基本模型,通过贝叶斯算法优化其超参数,将其运用到交通事件检测中,从而实现快速高效地交通事件检测。平衡数据集在现实生活中,正常运行状态样本数远比事件样本数多,检测器采集的是不平衡的交通数据集,因此交通事件检测实质上是不平衡二元分类问题。然而早期 算法大多数都是根据平衡数据集设计的,未考虑数据不平衡问题,实际上少数类样本对分类精度的影响更大,所以检测效果相对来说并不理想。将不平衡分类技术运用到交通事件检测中可以解决因为忽略小样本的交通事件数据造成的检测效果不理想、误报率较高的问题。目前,主流的不平衡数据处理技术是在数据层面上优化采样算法。-是以 为基础改进的合成边界样本的过采样算法 ,它将少数类样本分为安全样本、危险样本和噪声样本 类,能很好地解决样本分布边缘化问题。算法主要思想为:首先随机抽取少数类样本,收集该样本点的 近邻,用 表示 近邻中多数类样本的数量。然后进行类别划分,若 ,则所有位于样本中的近邻都被认定为多数类样本,被判定为噪声样本;若 ,表明多数类样本居多,样本容易被错误分类,被判定为危险样本;若 ,被判定为安全样本。最后根据过采样倍率对危险样本集中的样本进行线性插值,增加少数类样本的数量,再与原始样本集合得到新的数据集。构建初始变量集交通事件对交通流的影响导致交通流参数发生明显变化是设计 算法的基础。图 为事件发生时交通流变化特性,可以看出,事件发生点上游路段的流量和速度伴随着交通事件的发生会显著下降,占有率迅速上升;下游路段流量和占有率会下降,速度上升 ,因此交通流基本参数可以作为输入参数运用到检测算法中。为了更明显地表现出这些变化,可以考虑对同一检测器不同交通流参数间进行乘积、差值和比值的组合,还可以对上下游相邻检测器参数间进行类似的组合,使事件状态更凸显,如加利福尼亚算法利用上下游相邻 个检测器占有率数据的差值进行检测。图 和图 为交通事件发生时交通流参数在不同组合下的变化趋势,可以看出,各个交通流参数组合情况在没有发生事件时的变化都较为平稳,但是在发生事件后,各交通流参数组合都发生了较为明显的变化,产生了突变,说明参数间合理的不同组合方式可以更好地凸显出不同交通状态间的差异。图 事件发生时交通流变化特性图 上下游交通流参数差值的乘积变化特性图 交通流参数预测值与实际值的比值变化特性通过上述对交通流变化特性的分析,可以看出交通流参数(速度、流量、占有率)和它们间的不同组合方式与交通事件的发生密切相关,可以通过这些交通流参数的变化特性去判断交通事件是否发生。因此,本文以交通流参数为基础,对其进行多方式组合,构建相对全面的交通事件检测初始变量集。初始变量集由五部分组成,分别是:检测器实测交通流参数值;同一检测器实测交通流参数值与预测值的差值;上下游相邻检测器各交通流参数之差的乘积;同一检测器交通流参数预测值与实测值的比值;上下游相邻检测器实测交通流参数值的比值。表 为交通事件检测初始变量集,交通流参数预测值由移动平均法计算得到。表 交通事件检测初始变量集序号初始变量流量实测值速度实测值占有率实测值同一检测器流量实测值与预测值之差同一检测器速度实测值与预测值之差同一检测器占有率实测值与预测值之差上下游相邻检测器流量差与速度差乘积上下游相邻检测器流量差与占有率差乘积上下游相邻检测器占有率差与速度差乘积 同一检测器流量预测值与实测值之比 同一检测器速度预测值与实测值之比 同一检测器占有率预测值与实测值之比 上下游相邻检测器流量实测值之比 上下游相邻检测器速度实测值之比 上下游相邻检测器占有率实测值之比 基于 -的特征变量选择为了消除不相关和冗余变量,筛选出对分类有帮助的最佳特征子集,采用随机森林-交叉验证递归特征消除(-)算法进行特征变量选择,从而提高算法效率和分类准确度。随机森林与特征变量重要性分析随机森林(,)是一种集成学习算法,具有处理分类问题的能力,由于具有随机性,不容易造成模型过拟合,分类效果较好。另外其在对数据进行拟合处理时会生成一个变量重要性的度量指标,并能进行排序,由于其度量特性还被广泛应用在特征选择中。其基本思想是对每个特征在每棵树上的贡献程度取平均值,然后通过比较不同特征的贡献大小对特征重要性进行评估。最常 用 的 是 利 用 袋 外 数 据“”()的方法,算法主要步骤如下。步骤 构建随机森林。)利用 随机有放回地从 个原始样本集中选择 个样本,决策树由选择好的样本构成,袋外数据 由未选择的样本构成。张兵,等:采用特征变量选择和长短期记忆网络的高速公路交通事件检测研究)对决策树每个节点处的初始变量,随机选择 ()个变量,使用 个变量中最优的来分裂节点。)在整个森林生长过程中,每棵树都一直分裂下去,不需要剪枝。)上述步骤重复 次,以生成随机森林 ,。步骤 对于随机森林中的每个决策树,袋外数据 用于计算分类精度。步骤 将训练集中的每个初始变量记录为(,),并将随机噪声添加到袋外数据 的 中,以获得新的袋外数据 ,计算 中每个决策树 的分类精度。步骤 由式()计算变量 的重要度:()()-算法递归特征消除法()可以通过不断构建模型,根据特征系数依次选出最佳特征,但不能保证选出的特征变量个数是否合理。算法在递归特征消除的基础上对选出的特征集再进行交叉验证,从而确定平均分最高的特征数量,特征选择效果更好。具体过程如下。阶段:)选择初始特征集中全部有用的特征。)使用当前特征集进行建模,计算每个特征的重要性。)删除最不重要的一个(或多个)特征,对特征集进行更新。)跳转到第 步,直到完成所有特征的重要性评级。阶段:)以 阶段确定的特征重要性为依据,逐次对不同数量特征进行选择。)交叉验证选定的特征集。)确定平均分最高的特征数量,结束特征选择。-算法通过随机森林对变量重要性进行计算,根据计算结果进行排序,再由 筛除不重要变量,确定需要选择的重要变量。-算法流程如图 所示。图 特征变量选择流程 贝叶斯优化长短期记忆网络模型 长短期记忆网络长短期记忆网络()是递归神经网络的一种,以 单元作为其隐藏层的构建块,其对捕获长期依赖性具有鲁棒性,在处理时间序列时具有令人满意的效果。同时凭借其优异性能已成功应用于交通流参数预测,取得了突破性进展,我们有理由相信,网络具有提升基于交通流参数的交通事件检测效果的潜力。通过门控机制(遗忘门、输入门和输出门)实现对所需记忆信息的保留,能解决时间序列中的梯度爆炸和消失问题 。图 是 单元的内部结构。图 单元内部结构遗忘门接收上一时刻的输出 和输入,决定上一时刻的信息状态有多少保留到当前时刻,其输出为:(*,)()输入门接收相同的输入,决定当前时刻输入的信息有多少保存到细胞状态中,输出 个值:(*,)()(*,)()然后,细胞状态更新为式():*()输出门控制细胞状态有多少成为 的输出,其表达式为:(,)()最后,一个 单元的输出 为:*()()上述各式中,表示 激活函数;表示 激活函数;表示每个门的权重矩阵;表示每个门的偏置值;*表示点的产生。对于多层 ,只需将下层的输出作为上层的输入,重复堆叠即可。对于分类任务,只取最后一层所有隐藏单元的输出,然后将它们链接到全连接层以实现二元分类即可。基于贝叶斯算法的参数优化对于长短期记忆网络模型,需要优化的超参数有时间步长 和隐藏层节点数 ,目前常用的优化算法有随机搜索和网格搜索等,但这些算法都存在耗时久、结果不稳定的问题。贝叶斯算法在进行超参数优化时会考虑之前的评估结果,从而对代理模型不断修正,再将比较优异的超参数集中在一起,方便采样,能节省大量时间。因此,本文使用贝叶斯算法优化 模型的超参数,以获得更好的交通事件检测性能。贝叶斯优化基于贝叶斯定理(式(),是一种近似逼近的全局优化算法 ,包含概率代理模型和采集函数 个核心理念。()()()()()式中:是目标函数;(,),(,),(,)表示已观测集合;()是 的后验概率;()是 的先验概率;()表示 的边际似然分布;()表示 的似然分布。基于贝叶斯优化 模型超参数的步骤如下。步骤 设置需要优化的超参数的取值范围,对模型进行初始化。步骤 用代理模型替代原始目标函数,进行高斯过程回归,根据目标成本函数的损失值修正代理模型。步骤 使用采样函数选取代理模型中下一个需要评估的样本点,将 输入到 模型训练,得到新的目标函数输出值,更新样本集合(,),(,),(,)和代理