温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
NGN
档案管理系统
研究
仿真
鲜娅静
,研究与设计微型电脑应用 年第 卷第期作者简介:鲜娅静(),女,硕士,助理馆员,研究方向为纪检监察档案管理。文章编号:()基于 和 的档案管理系统研究与仿真鲜娅静(西安医学院,纪委,陕西,西安 )摘要:为了提高海量档案高维特征的超大数据集管理及分析效率,在研究了、网络、多核 等相关理论及概念基础上,设计了一种智能档案管理系统。该架构按层级可分为应用层、控制层和基础设施层,系统协调作用实现了高效地档案数据管理及分析功能。其中,提出了一种混合数据分析方法以提高数据分析效率。从大规模的未标记数据集中选择具有代表性的实例,以减少标记工作和训练时间,实现了不损失精度情况下提高数据分析效率。通过仿真及分析,与传统 方法相比,在不明显降低准确率情况下,提出的方法只需要标记一小部分代表性的训练实例可完成训练过程。关键词:档案管理与分析;下一代网络;通信;多核 中图分类号:文献标志码:(,):,:;引言随着移动通信和人工智能技术的不断发展,档案管理与分析也经历着前所未有的变革。按照不同的类型,档案可分为学术类、专题类、政府类、报纸类和私人信息档案类等。这些数据异构、多源的特点使得电子档案开始步入“海量”数据时代。如何高效管理及分析这些海量档案数据已成为当今重要研究领域之一。此外,随着 网络的普及,档案管理与分析面临着数据速率和容量高、成本低、端到端时延低、设备间需要大量连接等诸多问题。一个行之有效的解决方案是将下一代网络()引入档案管理与分析。是未来移动网络基础设施互联网协议()的基础,是一种通过核心骨干网降低成本,并提供一种融合的综合业务通信网络。具有成本低、兼容性强、快速部署能力强、可控的服务质量()、固定和无线网络以及集中式的网络管理等优点。刘伟等分析了 的层体系结构以及其关键技术,并给出 在安全方面存在的问题及解决方案。杨晓辉等基于 建立了一种新的煤矿通信系统。该系统利用 软交换平台将现有调度通信系统、无线通信系统、广播通信系统进行融合,从而实现了系统各终端互通互信功能。上述文献在各自领域研究了平台,并取得了一定成果。然而目前基于的档案管理系统仍处于摸索阶段,理论及设计水平有待进一步研究。然而,在对档案数据中高维特征的超大数据集进行分析时,通常面临着速度和精度的挑战。通常要训练一个高精度的模型,就需要尽可能多地使用训练样本。在处理大规模数据时,这可能会导致训练时间的显著增加,甚至导致难以处理或失败的训练。因此,在不需要标注大量实例的情况下,同时准确、快速地对大规模数据集进行分析是一个重大的挑战。为有效解决上述问题,本文将引入档案管理系统,提出了一种智能档案管理系统架构。该架构按层级可分为三层:应用层、控制层和基础设施层。各层级协同作用,为用户提供全面的数字档案信息管理、展示及数据分析。为进一步提高数据分析效率,本文还提出了一种混合数据分析方法。通过该方法可有效从大规模的未标记数据集中选择具有代表性的实例,以减少标记工作和训练时间,提升数据分 ,研究与设计微型电脑应用 年第 卷第期析效率。系统架构图为智能档案管理系统架构方案。该方案按层级可分为三层:应用层、控制层和基础设施层。各层级协同作用,为用户提供全面的数字档案信息管理、展示及分析平台。下面将对各层级组成及功能进行详细介绍。应用层应用层主要实现数据分析、界面管理等功能。档案数据分析是指在档案处理活动中进行的评价、整理、描述等认知任务。界面管理为系统与用户交互接口,实现数据查询、检索、分析等结果展示。图智能档案管理系统架构应用层的核心构建在三个模块上,即查询、检索和分析模块。需注意,系统所有资源都通过 发送处理请求。作为响应,可调用分析包,该包利用搜索模块提取感兴趣的数据集。然后,搜索模块通过 向系统发送一个搜索查询。当返回数据后,分析包生成结果并向客户端发送成功响应通知。在接收到成功响应时,将初始化另一个请求,以便通过 协议绘制该特定数据集的预测数据。最后,发送一个生成页面的请求,并调用页面生成器模块生成分析结果,在界面管理中展示。控制层系统中控制层主要由 物联网模块构成,实现 管理和网络功能虚拟化()功能。管理 基础设施可以通过运营商、互联网和第三方技术从一系列外部连接点访问系统。值得注意的是,这些连接点都隐含了系统中的安全漏洞,即攻击者可通过这些节点非法入侵系统。由于服务提供商使用相同的核心网络基础设施,如果单个提供商受到威胁,这将影响整个网络基础设施。指一个网络能够利用各种基础技术,为指定的网络通信提供更好的服务能力,是网络的一种安全机制,是用来解决网络延迟和阻塞等问题的一种技术。选项用于数据传输的服务用户配置信息,由为 参数存储的订阅数据库信息确定。网络的 管理用户终端可以在 上同时支持多个活动服务,并且每个服务都必须有自己的 配置文件。因此,目前的 管理引擎认为是基于 网络的 管理,并支持软件解决方案机制。网络功能虚拟化 的另一个作用是实现 。和 是互利互惠的,但不是相互依赖的。在实践中,可以在不使用 的情况下使用网络特性,反之亦然。由于 和虚拟化是互补的,因此两者可以在单独的网络功能和软件中使用。主要来自底层硬件设备(例如路由器和交换机,例如隔离的网络功能)的路由决策,以及使用开放接口(例如到远程服务器或网络云的开放流),因此整个网络架构可以采用自适应重构,方便灵活快速重建。和 的组合优于传统的基于硬件的网络。其主要优点是成本低、功耗低、网络运营商维护周期长,且数据管理、分析由集中设备集成的解耦网络提供。通过最大化网络增强和节省硬件资源,能够有效减少处理时间。基础设施层基础设施层主要由通信接口和硬件传输设施构成。通信接口包括主传输元件、物理和虚拟交换机、路由器和数据分析服务器。该设备收集网络状态、临时存储在本地网络设备上,并向网络控制器或分组管理员提供基于规则的管理。通信接口允许控制器与其他层交互。通信接口功能主要包括网络状态报告、分组转发规则的导入以及在不同服务中以不同方式的接入点控制。硬件传输设施主要使用光纤、光缆、网络云及无线方式连接。混合数据分析方法由于档案数据量大、数据结构多样(结构化数据和非结构化数据),这为档案数据分析带来了众多挑战。为了获得良好的精度和快速档案数据分析结果,本节将介绍一种混合数据分析方法。该方法介绍可分为三个步骤:训练实例选取、离群点检测与约简处理和多核 训练及测试。通过该策略可有效从大规模的未标记数据集中选择具有代表性的实例,以减少标记工作和训练时间,提升数据分析效率。训练实例选取为此,本文利用 的迭代特性寻找一个较小的实例集,代表整个数据集的分布。的结果受预先定义的聚类数和选择的聚类起点的影响很大,因此在同一个 ,研究与设计微型电脑应用 年第 卷第期数据集上运行多个 片段可以得到不同的聚类。聚类处理采用了一种特殊的策略,通过定义一个松弛的聚类数,反复多次运行 来寻找具有代表性的实例作为初始训练集。需注意,选择实例的比例对其代表性和整个算法的速度有显著影响,即选择实例的比例越大,代表性越好,但聚类时间越长。为此,本文作如下规定:当结果包含足够多不同类别的样本时,尽可能选择小的比值。具体执行过程如下。算法 聚类算法输入:样本集,簇的数目,最大迭代次数输出:个簇划分步骤初始化,为每个簇选取初始聚类中心步骤将样本按照最小距离原则分配至最邻近聚类步骤计算每个聚类样本均值并更新聚类中心步骤重复步骤(),步骤()直至聚类中心不再变化输出最优聚类中心和个簇划分将 聚类方法应用于原始数据集,并定义一个相对宽松的聚类数,重复运行 算法,这样每次都会得到不同的中心和边缘点。这些点将很好地代表整个数据集,足以训练出高精度的模型。离群点检测与约简首先,直接删除采集数据集中的重复数据实例,消除实例重复。一些异常实例仍然可能对构建分类器产生负面影响。为了找到离群样本,将一个给定的点到另一个点之间的统计量记为(检验),则有()()()()其中,是从点到集合中另一点的距离。检验 统计量的平均值将用于计算平均 统计量(),该统计量将根据以下公式生成异常值分数:()()()如果 大于测试实例的阈值,则相应实例将被视为异常值并直接删除。考虑到很难找到合适的阈值。因此,本文只需删除异常值得分最大的实例,并重复此过程几次。该方法将重复时间定义为重复异常检测时间。在此基础上,将得到简化的训练集,交由专家进行标注。多核 训练及测试在第三阶段,将选定的数据集作为训练集进行分类。经过聚类和数据约简阶段后,所选实例的大小大幅度减小,更适合于多核 训练。多核 模型比单个 模型具有更高的灵活性。在多核映射的背景下,高维空间成为由多个特征空间组合而成的组合空间。由于组合空间充分发挥了各基本核不同特征的映射能力,能够将异构数据的不同特征分量分别通过相应的核 函 数 得 到 解 决。多 核 模 型 具 体 原 理 如 图所示。图多核 模型原理实验与分析本节以常用的种档案数据集为例,验证所提方法的有效性。数据集分别为乳腺癌数据集(),包含 组 维数据,良性 ,恶性 ;车辆评估数据集()包含 个实例,每个实例个属性;糖尿病视网膜病变数据集(),该数据库由 度视野数字眼底相机在不同的成像设置下拍摄的 张彩色眼底图像组成,其中 张至少包含糖尿病视网膜病变的轻度非增殖性体征(微 动 脉 瘤),张 正 常 图 像;图 书 推 荐 数 据 集()为互联网上 图书社区的 个用户对 本书进行的评分,包括显式和隐式的评分。由于实验条件有限,系统仿真时采用 语言编译,以台服务器和台客户端组成无线连接(网络)和光纤连接方式模拟智能档案管理系统运行模式。图所示为本文所提架构与传统集中式架构在不同数据集下的检索效率对比结果。由于本文所提架构数据管理由集成的解耦网络提供,因此能够有效减少处理时间。图检索效率对比结果将本文所提数据分析方法与传统的 方法进行比较。表所示为不同数据集的精度和执行时间比较结果。表第列中的参数包括用于聚类的实例比率()、均值聚类的聚类数(),均值聚类的重复次数()和删除离群值得分最高的离群值的重复次数()。经过聚类和离群点检测处理,得到少量具有代表性的实例。第列展示了代表性训练实例的数量,且只有这些实例标记基本真值标签。可以看出,传统的 需要大量的实例进行训练,这意味着需要花费大量的人力和时间来标记实例。本文方法只需要标记一小部分代表性的训练实例,且不会明显降低准确率。因此,所提方法大幅度减少了人工标注的繁重工作。(下转第 页),研究与设计微型电脑应用 年第 卷第期总结布线系统性能不但关乎建筑群内用户通信质量,还影响着公用网络的畅通。因此本文利用微粒群算法设计一种结构化综合布线系统。确定设计流程,并将该系统划分为多个子系统,通过微粒群算法确定出需要的线缆长度,使布线更加合理。仿真实验证明,此系统能够减少后期变更费用,减少通信干扰。参考文献汤浩,刘耿耿,郭文忠,等考虑布线资源松弛的结构 最 小 树 算 法 模 式 识 别 与 人 工 智 能,():姜康,马世纪 基于改进 算法的线缆路径规划方法中国机械工程,():郭学鹏,朱永国,王发麟,等基于个体扰动变异粒子群算法的线缆布线顺序规划方法 计算机集成制造系统,():汪大绥,包 联 进我国超高层 建 筑 结 构 发 展 与 展 望建筑结构,():张亚玲,王跃飞,黄联盟 超高层建筑设备机房机电安装一次成优率提升方法 施工技术,():杨扬,李纳高层建筑平面设计研究:评 高层建筑标准层 平 面 设 计 例 工 业 建 筑,():杨振宏,马悦,张梦洁,等 基于物流设施规划的建筑施工现场平面布置优化安全与环境学报,():张王俊,程丹明 基于区块链的电力数据共享机制研究 自动化技术与应用,():冯跃电检修无功电压线的光纤系统研究自动化技术与应用,():(收稿日期:)(上接第 页)表不同数据集精度和执行时间比较结果数据集采样次数参数训练实例大小精度执行时间本文方法传统 本文方法传统 本文方法传统 ;总结本文对海量档案数据管理与分析进行了研究,并提出一种只能档案管理与分析系统。此外,本文还提出了一种混合数据分析方法。该方法结合了均值聚类法和离群点检测法在大规