温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
铁路
建造
系统
数据
共享
平台
研究
张红勇
Science&Technology Vision科技视界0引言川藏铁路作为中国国内第二条进藏铁路,全长1838 千米,连接了四川省和西藏自治区,是中国西南地区的干线铁路之一,其建设对于西藏的经济发展具有极大的促进作用1。川藏铁路的建设难度无疑是巨大的,除了需要克服在高原建设铁路的种种难关,还需要处理其线路经过许多危险区域的问题2。从建国初期开始进行川藏铁路的勘察工作,到 2021 年 6 月已经实现了我国首条高原电气化铁路开通运营。目前,新的川藏铁路线路也相继进行了招标和开工建设,其建造的复杂性需要更加强有力的技术支持。随着科技的不断发展,我国铁路隧道向着信息化和智能化的方向迈进,借助信息技术降低铁路建设的困难程度,逐步推动我国铁路建设由高速发展向高质量发展迈进3。作为铁路建造的基础,对数据高效利用的需求推动数据共享平台的建设。本文调研铁路建设的发展现状,梳理分析数据的关键作用;学习铁路建造中相关专家学者在数据领域做出的研究贡献。根据调研的信息,结合铁路实际应用需求构建铁路建造数据共享平台的系统架构,并且介绍密文策略属性加密算法与针对 DDoS 流量检测算法保障数据共享平台的安全性,通过该平台打破数据壁垒,实现系统数据的互联互通、共建共享。1铁路建造研究现状川藏铁路建设项目具有里程长、构建难度大的特点,在实际建设中需要海量多源异构的数据,但是目前的数据处理和使用中存在数据难以共享互通的现象,数据的分散使铁路建造无法充分挖掘和利用数据中蕴含的隐藏信息,所以如何利用信息化的手段对数据进行采集、处理、共享和存储成为铁路工程建设现代化急需解决的问题4。为了分析项目因素与高速铁路施工工期之间的关系,王朝俊5收集利用了铁路建设数据,将它们用于DOI:10.19694/ki.issn2095-2457.2022.26铁路建造系统数据共享平台研究张红勇1左睿1王佳星2(1.中铁云网信息科技有限公司,北京100039;2.北京邮电大学,北京100876)【摘要】近年来铁路发展十分迅速,川藏铁路作为 新世 纪 的 伟 大 工 程,建 造 中 的 复 杂 性 要 求 大 量 数 据 的 支 持 和 互通。随着信息技术的不断发展进步,如何利用信息化 的 手 段 打 破 原 本 铁 路 建造 中 各 系统机 构 间 的 数 据 孤 岛 的 现 状,实现 数据贯通与分析,为铁路建 造 提供有力的数据支 持,是 现 阶 段 研 究 的 重点 问题。本文分析了 铁 路 建造 的研 究现状,结合 需 求 构 建 铁 路 建 造 数 据 共 享 平 台 的 系 统 架 构,为 保 障 数 据 共 享 的 安 全 性,运 用 联 盟 链 帮 助 数 据 的 存 储 与 共 享,提 出密 文 策 略 属 性 加 密 算 法 控 制 数 据 的 访 问,提 出 针 对DDoS流 量 检 测 算 法,检 测 对 系 统 的 恶 意 干 扰。该 架 构 的 提 出 为 该领 域数据贯通相关方 向的发 展和信息化进程提 供 有 力 的借鉴。【关键词】川藏 铁路;铁路建造;数据共享;数据贯 通作者简介:张红勇,高级工程师,研究方向为BIM技 术,智 能 建造等。左睿,高级工程 师,研究方向为智能建造、北斗 技 术 应用。王佳星,博士(在读),研究方向为区块链等。科学课堂09713科技视界Science&Technology Vision统计回归分析中分析相关参数的影响。史剑6设计了数据交换平台框架来解决铁路建设项目中地域分布复杂和工程数据多样性的问题。为适应信息化发展的现状,解决传统数据中心扩展受限,李斌7提出了铁路云数据中心总计技术架构,为铁路云数据中心的建设提供强有力的理论与技术支持。针对铁路缺乏科学化地理数据管理系统的问题,陈隆8提出了建立铁路地理数据管理系统,提高了数据管理的科学性。2系统架构根据实际需求与平台规划,将铁路建造系统数字共享平台架构分为五个层次,分别为应用层、数据服务层、数据处理层、感知层、基础环境层。架构各层次及具体内容如图 1 所示。(1)应用层:应用层为数据共享平台的系统应用界面,操作人员由此页面进行数据的查询、存储等操作。根据使用的人的职责不同,对他们开放不同的接口接入平台。配备了相应的管理人员,分别通过平台对数据和数据涉及的业务进行管理,同时配备系统管理与维护人员,推进数字共享平台的正常运行。(2)数据服务层:数据服务层主要分为数据共享服务模块和数据与模型构建模块。数据共享服务模块主要围绕的是数据生态系统,该模块是整个数字共享平台的核心,通过该模块实现对多源异构数据的统一存储、管理、更新和维护;实现对平台的基础空间数据的共享;共享其他部门体系的专题数据,真正实现在避免信息重复建设和信息孤岛的前提下,实现数据的互通共享。在数据与模型构建模块,以数据共享服务模块为支撑,实现对数据的有效利用,利用共享数据进行信息整合,为铁路建造过程中的必要工程提供信息化分析,构建各种数字化模型,包括构建地理环境模型、结构模型、施工过程模型、运维模型等,能够实现对建造工程难题进行攻克和对建造过程的有效监控。图1铁路建造系统数字共享平台架构科学课堂098Science&Technology Vision科技视界(3)数据处理层:主要实现对数据的处理工作,作为数据服务层的基础支撑。数据处理层主要包括三个部分,从下而上分别是数据预处理、数据存储与计算、数据分析,三层在逻辑上是推进的关系。感知层获取数据后,首先进行数据预处理工作,在数据预处理层完成数据清洗、数据转换、数据描述、特征选择、特征抽取。在数据清洗阶段,首先处理缺失值和噪声数据。数据缺失表示为存在 NA 的数据,噪声数据则表示为异常值。对于这两类问题数据,可以根据数据在其中的影响程度来决定处理方式,如果数据的影响不大,那么就可以将该数据直接去除;如果有一定的影响,那么可以根据相关特征进行推测填补,针对连续数据也可以使用均值或者中值进行填补。在数据转换阶段,对数据进行采样、转换和归一化处理。通过采样查看数据集的数据类型,再将不同数据集转化为数值型数据,消除特征之间的量纲影响,对数据进行标准化处理。在数据描述阶段,可以根据具体数据的需要进行统计并实现数据的可视化。特征选择是指对数据进行分类别存储时针对该部门所需要的数据进行相关特征提取,去掉冗余的特征信息。特征抽取是指借助主成分分析法和线性判别方法对高维度数据进行的降维处理。在对数据进行处理之后,在数据存储与计算层对数据进行使用与处理。数据混合存储中心存储不同部门共享的数据,并且根据具体部门和数据类型对数据进行分类。这个中心主要负责共享数据的存储,借助相关的技术来保证不同数据的机密程度,实现在共享的同时防止发生数据篡改和机密数据遗失的情况,具体涉及的关键技术将在第三部分进行详细的介绍。除此之外,存储中心还与数据实施处理中心进行数据的交互,从存储中心提取需要处理的数据,根据具体需要实施再次处理的数据也会保存在数据混合存储中心中。由于需要借助信息化的手段利用数据,所以平台架构在设计的时候,还考虑到对数据的运用上。借助信息技术的手段,将普通共享存储的数据进行综合分析,从中抽取到深层次的对铁路建造有帮助的信息。根据数据分析的类型不同,我们将分析的数据分为探索性数据、定性数据、离散数据、在线数据。而根据数据分析的处理方式不同,分为数据挖掘、机器学习、深度学习、人工智能和统计分析这几个数据分析的方式。(4)感知层:主要进行数据的收集工作。根据数据产生方式的不同,将数据分为铁路建造相关部门数据和实地感知数据。相关部门数据是铁路建造过程中从初始勘察、设计到实际施工和完善等工作所产生的数据,该数据包括了历史记录的数据和当下建造过程中产生的数据。实地感知数据是指当地地形、气候状况、植被覆盖等自然条件的数据信息,通过摄像头、各类型传感器和 GPS 等工具探测获得。(5)基础环境层:为促进整个平台的运行,需要相应的软件和硬件环境作为平台运行的支撑。其中包括了网络体系、运行生态、计算机存储系统和安全系统。除此之外,还有相应的标准体系作为对平台运行和使用的规范。整体体系从数据的使用规范、系统运维规范、平台管理规范和安全等维度进行标准体系的约束。3关键技术研究对支持整个系统安全运行的技术进行介绍。3.1区块链技术区块链是一种由节点参与的、去中心化的分布式数据库系统,其本身是一串使用密码学的相关联的数据块,数据块中存储着有效确认的信息。区块链的主要作用是储存信息,任何需要保存的信息,都可以写入区块链,也可以从里面读取。区块链没有中心节点,信息存储在所有加入进区块链网络的节点当中,每个节点都是平等的,都保存着整个数据库。你可以向任何一个节点写入或者读取数据,所有节点最后都会同步,从而保证区块链的一致性9。由于区块链具有透明化、去中心化、开放性和信息不可篡改性等特点,所以我们在构建数据混合存储中心的时候考虑借助区块链技术作为支撑。又由于不能完全对外开放所有数据信息,所以选择联盟链作为存储中心的一部分。根据数据的重要程度不同,分为需要加密的数据和开放性数据。如图 2 所示。为了方便数据的共享,我们将数据存储在云端,方便不同数据使用者进行数据的读取操作。开放性数据直接存储在云端,这一部分是基础数据,保密程度科学课堂099科技视界Science&Technology Vision比较低,存储在云端除了有助于建造工程中数据的方便共享和使用,还有助于其他相关行业对数据的利用,提高了数据的利用率。图2用户读取数据分类借助联盟链存储有一定保密级别的数据。联盟链是一种由多个机构共同参与管理的一种区块链,数据只允许系统内不同机构读写和发送。为了保证数据的安全性和隐私性,使用一种密文策略属性加密算法对数据的访问进行控制。这是一种比角色访问控制更细粒度的加密算法,只有当用户的属性集合满足相对应的访问控制的时候才可以使用相对应正确的密钥去解密密文,获得真正的信息。这就限制了数据共享的范围,使数据在共享的前提下还能保障数据的安全性。算法的一般流程如下:(1)输入一个安全参数,获得对应的密钥 CK和公钥 PK。CK,PK=Dist()。(2)输入数据 D、访问结构 T、公钥 PK,输出根据加密后的密文S=Encrypt(PK,D,T)。(3)输入用户的属性 Z(相关获取数据信息的资格证)、密钥 CK,输出对应的私钥 SK。(4)对比用户的私钥 SK 和 Z,如果满足 ZT,那么可以获得解密后的数据 DD=Decrypt(SK,Z)。3.2针对DDoS流量检测算法在数字共享服务中,如果有恶意干扰系统的正常运行,可能会存在 DDoS 攻击的情况出现。DDoS 攻击被称为分布式拒绝服务攻击,是通过操纵僵尸主机,以大量的源主机向目标主机进行攻击的一种攻击手段10,攻击者往往针对各协议一些固有的逻辑漏洞进行利用,通过大量发送攻击数据占满服务队列或是挤占正常带宽的形式阻止目标服务器正常提供服务。DDoS 流量检测属于机器学习领域中典型的分类任务,在前人的研究中,R.C.Staudemeyer 和 C.Omlin通过决策树的方式11,对 KDD 数据集中的各个流量特征进行了筛选,经过对比后最后选出 11 个与 DoS 攻击相关的重要特征。但在具体实验过程中,部分特征相关度较高,在实际模型训练过程中所提供的训练效果有限。在对这十一个特征划分不同的组进行分别训练后,去除了相关性过高的六个特征,最后保留了五个流量特征作为 DDoS 流量检测算法所关注的特征。这五个流量特征包含两个流量基础特征和三个流量统计特征,分别是:(1)流量数据包目标主机所提供的服务类型;(2)该连接在结束时的连接状态,例如正常完成或发生错误;(3)在该连接所有数据包中从源主机到目标主机发送数据字节数;(4)在过去两秒内,在与当前连接具有相同目标主机的其他连接中,与当前连接使用相同服务的连接的百分比;(5)在此之前的 100 个连接中,与当前连接具有相同目标主机并且使用相同服务的连接中,出现 SYN错误的连接所占的百分比。对于 TCP 流量,后三个特征需要对 TC