2023年第1期·实践经纬·53档案语义参照框架:逻辑、架构与实证赵生辉1胡莹2宋和平2(1.西藏民族大学管理学院,咸阳712021;2.云南大学历史与档案学院,昆明650091)摘要:应对档案数据化面临的“语义鸿沟”挑战,提出“档案语义参照框架”的学术概念,构建其基础逻辑体系和技术架构,并通过案例进行验证。档案语义是由依附于档案载体的自然语言文本所映射的事实性信息的集合。“档案语义参照框架”是专门为档案文本或档案数据的语义标注和智能检索提供基础语义参照服务的公共基础设施,是“潜在语义空间”的逻辑定位体系。“档案语义参照框架”致力于从时间、空间、职能三个维度,基于标准化的结构语义框架、事理语义框架和档案内容实体唯一标识符,通过“逻辑外显”“逻辑降维”“逻辑指代”和“逻辑关联”,实现档案语义数据的“结构化”和“归一化”,使其在基础语义层面获得统一的处理逻辑。“档案语义参照框架”有助于减弱“语义鸿沟”的影响,对我国档案信息化建设的智能转型将起到重要支撑作用。关键词:档案数据化;语义鸿沟;档案语义;结构化;归一化中图分类号:G270收稿日期:2022-01-20作者简介:赵生辉,博士,教授,研究方向为民族信息学、档案数据科学、史料人文计算,E-mail:fool-birdzsh@126.com;胡莹,博士,副教授,研究方向为历史文献学、少数民族档案管理、数字人文;宋和平,硕士研究生。基金项目:教育部哲学社会科学重大研究攻关项目“元明清时期中国边疆治理文献整理与数据库建设研究”(21JZD042)。我国学者对档案语义相关问题的研究大体上与语义网技术的发展和应用同步,带有鲜明的技术驱动和工具型特征。1998年,“万维网之父”英国计算机学家蒂姆·伯纳斯·李(TimBerners-Lee)提出语义网(semanticweb)堆栈模型。[1]同年,我国学者胡明[2]基于语义网络(semanticnetwork)方法开发了文书档案自动著录和全文检索系统,这是已知较早的相关成果。进入21世纪,国内多位学者先后就语义网技术在档案领域的应用问题展开探讨。例如,林周佳[3-4]探讨了基于语义网的数字化档案馆技术架构和档案语义级检索问题;段荣婷[5]探讨了基于简约知识组织系统的《中国档案主题词表》网络化应用问题;吕元智[6]探讨了数字档案资源体系的语义互操作问题;张素萍[7]探讨了基于语义的电子健康档案信息组织模式;张倩[8]探讨了语义网对高校档案信息检索工作的应用价值。近年来,在数字人文浪潮兴起等因素驱动下,档案领域语义网技术应用研究呈现出逐渐增多的趋势。例如,熊华兰[9]研究了基于语义...