温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
档案
数据
底层
逻辑
解析
研究
冬雪
2282023 年第 1 期实践纵横BEST PRACTICE“档案数据化”底层逻辑解析研究胡冬雪(自然资源部第三地形测量队,哈尔滨 150001)摘要:档案数据化无疑是档案领域发展的里程碑,通过将传统档案转至数字档案信息,拓宽档案数字化管理形式,最大限度地降低档案原件使用率,保护档案元件。本文通过梳理档案数据化形成背景,围绕知识元理论提出的展现档案特色记录因子理,论深度解析档案数据化底层逻辑,以提升档案管理效率,推动档案管理智能化与细粒度档案数据服务管理过渡。关键词:档案数据化;底层逻辑;解析随着经济水平大幅度提升,信息技术也在此背景下实现蓬勃发展。档案从以往纸质化转至数字化,使档案实现真正意义层面现代化。通过系统梳理档案数据化形成背景,了解相关理论知识,有利于理解档案数据化底层逻辑,切实提升档案利用率,推动档案行业蓬勃发展。一、档案数据化的形成背景(一)档案形成生态环境变化人类在人际交往、信息传播、日常生活中为便于保存、传播与沟通,将所有客观存在处理为数据,使整个人类社会形成巨大数据库。数据化社会推动信息技术革新,创造不同于以往的生活方式、工作业态及生产模式,在物理世界层面架构数据世界,打造档案工作社会生态环境,加快档案工作与数据融合与关联。档案形成生态从数字态、模拟态转至数据态。档案真实记录社会活动,而数据化则从源头层面改变档案信息读取、记录、存储及传播,大量产生的档案数据逐渐形成原生环境数据化、来源形态数据化、形成方式数据化的档案形成生态。档案资源形态也从数字态和模拟态向数据态转变。目前档案信息资源主体即档案数据,推动档案工作从管理档案实体转至管理档案数据这一形态变化。(二)档案工作从数字至数据档案数据在全面促进大数据布局与发展中成为档案管理工作重案数据”一词,说明国家档案事业发展顶层设计中已纳入档案数据管理。自开展档案信息化工作后,档案部门开展数字档案馆建设、数字化扫描、数字化利用服务等档案数据化管理实践。虽然有效解决以往存在的档案管理信息载体转换、数字存储与利用等问题,然而也只使档案描述、呈现及利用方式发生改变,未能较好地控制档案信息内容层级与力度,生层次挖掘档案价值更不知从何谈起,急需从数字化转至数据化。档案部门正积极探索档案数据化实践,尝试将档案管理对象与方式转至数据及数据化。例如上海自贸区则率先推行和应用电子档案单套制管理模式,即将 OA 办公流程对接电子档案管理流程与电子文件归档,通过电子档案管理原型与电子文件归档高效管理电子档案目录数据、内容数据、管理利用数据及元数据。浙江省构建自动化电子文件管理体系并在此基础上制定公共数据管理方式、大数据归档范围及标准、电子文件归档数据智能化及相关规范的档案信息服务网,建设智慧化档案管理体系及档案数据共享、传输及交换机制,使档案数据高效服务于社会。二、档案数据化底层逻辑分析(一)基于记录因子理论下的档案数据化内涵记录因子值基于图书情报层面中的“知识元”所提出的展现档案内容本质特征信息组织理论,若想深层次剖析档案数据化底层逻辑,就要充分了解知识元相关内涵。“知识元”重点即在知识控制与处理基本单元时发挥细粒度知识作用,和其表述相似的还有知识基因、知识因子等。和研究报告、论文、期刊、图书等大粒度文献组织而言,知识元可细分领域知识体系。与此同时,知识元属于无法划分的独立知识单位,属于知识结构不可缺少组成及粒子化知识概念。知识元特征共有以下三方面:拓扑性;即知识元间相互链接形成特定知识结构;链接性即知识元间存在直接或见解关系;原子性即知识元可相互区分的独立知识单位。若要根据知识元组织细粒度知识,以往以文献为管理对象模式已不2292023 年第 1 期实践纵横BEST PRACTICE适用,需从对文献自身关注过渡至对文献内容关注,选取合适知识元方式描述知识元并建立模型,再经知识元抽取、链接、标引、集成、检索等一系列环节建立面对所有用户的智能化与细粒度的知识服务基础设施。当前档案信息化建设重点领域即档案数据化,需借助记录因子理论才能理解其运行机制及各类实践模式间互动关系。在此过程中底层逻辑指驱动档案数据化内在动力机制与微观动因。基于记录因子理论分析而言,所谓档案数据化即档案管理基本单元从最初粗粒度文档朝着细粒度记录因子转变,档案管理活动倾向于涵盖整体性特征的档案领域本体数据集,由此一来,档案文档中包括的大量记录因子会渐渐脱离初期信息控制单元束缚与限制,根据档案文档在社会历史活动中最具有的原始逻辑再次重组和关联,旨在精准匹配和满足用户需求。(图 1所示)图 1记录因子理论下的“档案数据化”原理分析图 1 可知,自然语言记录人类在社会实践活动中形成的各种档案信息,颗粒化社会记忆的记录因子存储于每份档案文本中,使不同历史阶段组织或个人对社会活动原貌认知结果得到真实反映。对于档案数据服务而言,其第一要务即由信息控制基本单元文档中抽取记录因子,基于规范逻辑集中整合档案领域本体数据,实现真正意义层面档案数据化。图 1 以虚线表示数据,说明该数据产生来自于对现有多个记录因子语义推理,并非来自档案本文。一般档案领域所涵盖的本体数据均具备证据价值,而此价值据决定于构成其每个记录因子证据价值,确保所有记录因子来自真实档案,经语义推理方式形成数据均有完整过程记录,那么档案本体数据集可作为可信度较强的档案数据服务基础设施,取得用户信任。记录因子则可围绕用户需求展开动态化重组与精准匹配。档案数据化提出可在一定程度转变档案管理机构职能,此时档案文档从以保存与利用的辅助型服务机构朝着向社会大众提供可靠性和安全性较强的档案内容数据服务等公共权威机构。在档案本体数据集模式下,用户无需如往常一般翻阅档案文档即可迅速获取关键信息,享受智能化、精准与细粒度档案数据服务。一般从可信档案层面本体数据集检索数据来自多份原始档案,档案管理部门对其盖章确认后,其作用和效力与原始档案相同,换言之可在社会活动中作为证据进行使用。(二)档案数据化实践模式档案数据化并非独立存在,其中档案部门发挥主导作用,集结信息技术支持、业务及标准化管理等多部门,多个主体共同推动档案数据服务创新。档案数据化基于记录因子理论开展档案领域本体建模(A/D4-2)主线实践模式。然而,档案文档量巨大,记录因子抽取与融合间存在较大难度,短时间无法实现脱离档案文档高效化与高水平智能数据服务。(图 2 为档案数据化实践模式间互动)图 2档案数据化实践模式互动从图 2 可得知,档案数据化旨在对档案管理实施建模,抽取涵盖于数据档案内记录因子,再将其融合为统一整体,上述为档案数据化不可缺少实践体系。由于档案自身建模具有显著的艰巨性、长期性与复杂性特征,融入于本体库中记录因子数量无法配合档案数据服务,此时处于建设过程中档案领域数据集可扮演档案知识组织系统作用,为档案文本智能化检索提供有力支持。当语义标注数字档案元数据或文本参照主体后,2302023 年第 1 期实践纵横BEST PRACTICE文字符号歧义与多义性理解现象会得到消除,获得精准数字档案文献检索结果。若在开发业务部门办公自动化系统时就可融入档案数据化需求,可在档案文本生成初期即可准确实现结构化描述,便于计算机高效处理人工阅读,进一步推动档案文本结构化的档案数据化实践模式。以此同时,业务数据档案化模式则在档案管理范畴中纳入业务部门开发的各类业务数据库,规范化控制数据库管理中各类要素,若条件充足则可对业务部门形成的一系列数据记录行归档操作处理,再与档案领域本体数据集相融。档案数据化建立档案领域本体数据集在档案数据化情境下可作为由语义标引的逻辑参照体系,在档案文本结构化情境驱动下成为划分文本层级与经语义标注的参照标准。档案领域本体数据集覆盖面会因业务数据档案化得到扩大,持续强化档案本体对社会历史本体表征能力,大幅度提升档案数据检索查准率与查全率。总之,档案数据化不同模式可相互补充与长期共存,最重要在档案信息化建设中发挥各自价值,在具体实践中从哪方面着手需参考地区档案信息化建设协作机制与档案信息资源开发水平,由此一来才能发挥档案数据化优势作用。三、档案数据化的相关建设(一)完善档案内容互联网多媒体技术的迅速发展,使当前各个领域都在运用科学信息技术简化工作流程,降低人力劳动,提升工作效率。档案数据化工作也是如此,如果想要提升档案数据化水平,也一定要抓住互联网多媒体的先进技术,促使档案数据化朝着信息化、科学化、合理化方向不断过渡。档案管理者自身应改变传统错误思想观念,在档案数据化中充分发挥信息技术优势,将一些新型的信息技术用到档案数据化之中。例如,针对人力资源档案管理内容建立档案信息库,将人力资源一些档案材料按照材料的内容和作用以及材料的应用领域进行分类整理,以节约提取档案的时间。若企业积极提倡使用电子存储的模式进行档案管理,冲破传统纸质存储的方式方法。利用电子存储的方式进行档案数据化管理,不但能够在一定程度上节省资源,而且对档案数字化工作效率的提高也起到很大的作用,使档案数字化案管理变得更加的合理规范,能够充分发挥其自身的的作用和价值,使相关主体能够利用信息资源取得更近一步的发展。档案数据化并非单纯地购买相关设备软件,而是从根本上转变档案内容与模式,即借助信息技术转化传统纸质档案,使档案成为便于存储、调取、应用、传播的电子档案资料,再系统化整合与管理已转化的电子档案信息,成为高效且统一的信息化平台,为查询与管理档案提供极大便利。在具体管理中应从多方面加以强化,档案管理人员作为档案管理主体,在日常工作中应积极改变传统档案管理模式,从多渠道关注业务有关讯息,并在此基础上收集有关的档案信息资源并建立成库,丰富档案资源内容,由此一来高档案数字化工作从被动管理转为积极主动吸取与整合。与此同时,借助信息档案数字化系统对主动收集的档案资源和已有档案资源实施分类整理,将相似主题档案归结至一起并编制相应的检索目录,为工作人员查询档案提供便利,最重要能二次或多次利用有价值的档案资源。(二)加强档案安全档案安全属于档案管理不可缺少的组成,信息化的快速发展带给网络很大的不安全性,这就需要对档案数字化进行保障体系的建立,以达到对其信息的安全保障。针对档案数字化安全保障可从以下方面着手,首先,主动提供安全保障;档案数字化安全保障是整合资源、接受与长期保存以及利用、共享等工作基础,需基于信息安全基础上制定安全保障对策。在电子档案保管阶段需重点维护电子档案真实性,常用以下措施,其一建立电子档案元数据管理机制,该机制经固化管理过程后形成连续且完整的保管链。其二时间戳技术与数字签名,主要针对电子档案内容和来源,有效保障电子档案安全。其三创设复合式身份标识,该方式综合多种技术方式和算法且纳入凭证库管理机制。在应用电子档案过程中不单单要保证原档案资料不受到损害,还需控制档案应用范围。由于工作人员搜索和调取电子档案在于解决相关问题,为避免电子档案原件受到恶意破坏和篡改,可利用者提供电子档案副本,满足工作人员需求。参考文献 1 王力.档案数据化管理实现路径研究 J.兰台内外,2022(18).2 苏永芬,吕晨曦.大数据背景下档案数据化管理 助力企事业单位发展的策略探讨 J.四川档案,2022(03).3 张慧颖,曹玉.国家综合档案馆档案数据资源智慧化管理路径及其实现机制研究 J.北京档案,2022(06).4 李福春.探析大数据背景下档案管理有效性的提高对策 J.科技资讯,2022(11).责编:陈頔