分享
人工智能安全知识图谱构建技术研究_沈晓晨.pdf
下载文档

ID:2582307

大小:2.19MB

页数:11页

格式:PDF

时间:2023-08-01

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
人工智能 安全 知识 图谱 构建 技术研究 沈晓晨
2023 年 4 月 Chinese Journal of Network and Information Security April 2023 第 9 卷第 2 期 网络与信息安全学报 Vol.9 No.2 人工智能安全知识图谱构建技术研究 沈晓晨1,葛寅辉1,陈波1,于泠2(1.南京师范大学计算机与电子信息学院/人工智能学院,江苏 南京 210023;2.南京师范大学数学科学学院,江苏 南京 210023)摘 要:人工智能技术在飞速发展的同时引发众多安全隐患,现阶段人工智能安全数据来源广泛、种类复杂并且缺乏规范描述,为此提出了一种人工智能安全知识图谱构建方法,利用知识图谱对当前多源异构数据进行分析与整合,将复杂关联的数据进行科学表示,挖掘潜在价值并形成领域知识库。针对人工智能安全领域概念的多样性和关联性,提出一种分层结构人工智能安全本体,使本体结构更加多元化和扩展化,为知识图谱构建过程提供规则约束,并基于此形成人工智能安全知识库;为了有效利用特征信息及减少噪声干扰,采取基于双向长短时记忆网络条件随机场(BiLSTM-CRF)的命名实体识别算法和基于卷积神经网络注意力机制(CNN-ATT)的关系抽取算法进行信息抽取,利用构建的人工智能安全数据集证明算法性能;以提出的安全本体为知识体系,以 3D 效果展现人工智能安全知识图谱多层次可视化结果,有效关联多源安全数据信息。实验结果表明,信息抽取算法性能良好,取得了比传统方法更好的效果;构建的人工智能安全知识图谱直观展示了层次结构及相互关系,符合准确性、一致性、完整性、时效性维度的知识图谱多维度评估标准,能够为人工智能安全研究提供支持。关键词:人工智能安全;知识图谱;本体构建;信息抽取;可视化 中图分类号:TP391 文献标志码:A DOI:10.11959/j.issn.2096109x.2023030 Research on construction technology of artificial intelligence security knowledge graph SHEN Xiaochen1,GE Yinhui1,CHEN Bo1,YU Ling2 1.School of Computer and Electronic Information/School of Artificial Intelligence,Nanjing Normal University,Nanjing 210023,China 2.School of Mathematical Science,Nanjing Normal University,Nanjing 210023,China Abstract:As a major strategic technology,artificial intelligence is developing rapidly while bringing numerous security risks.Currently,security data for artificial intelligence is collected from disparate sources and lacks 收稿日期:20220709;修回日期:20221225 通信作者:陈波, 基金项目:教育部科技司赛尔网络下一代互联网技术创新项目滚动项目(NGIICS20190504);江苏省“十四五”教育科学规划重大课题(A/2021/05)Foundation Items:The CERNET Next Generation Internet Technology Innovation Project under the Ministry of EducationsScience and Technology Department(NGIICS20190504),The Education Scientific Planning Project of Jiangsu Province duringthe“14th Five-Year Plan”(A/2021/05)引用格式:沈晓晨,葛寅辉,陈波,等.人工智能安全知识图谱构建技术研究J.网络与信息安全学报,2023,9(2):164-174.Citation Format:SHEN X C,GE Y H,CHEN B,et al.Research on construction technology of artificial intelligence securityknowledge graphJ.Chinese Journal of Network and Information Security,2023,9(2):164-174.第 2 期 沈晓晨等:人工智能安全知识图谱构建技术研究 165 standardized description,making it difficult to integrate and analyze effectively.To address this issue,a method for constructing an artificial intelligence security knowledge graph was proposed.The knowledge graph was used to integrate the current multi-source heterogeneous data,scientifically represent complex relationships of the data,mine potential value and form a domain knowledge base.In view of the diversity and correlation of concepts in the field of artificial intelligence security,a hierarchical structure of artificial intelligence security ontology was proposed to make the ontology structure more diversified and extensible,provide rule constraints for the process of knowledge graph construction,and form an artificial intelligence security knowledge base.To effectively utilize feature information and reduce noise interference,named entity recognition algorithm based on BiLSTM-CRF and relationship extraction algorithm based on CNN-ATT were adopted for information extraction.The constructed artificial intelligence security dataset was then used to verify the performance of the algorithm.Based on the proposed ontology,the multi-level visualization results of the artificial intelligence security knowledge graph were presented in 3D effect,effectively connecting the multi-source security data information.The experimental results show that the constructed knowledge graph meets the multi-dimensional evaluation criteria of accuracy,consistency,completeness,and timeliness,providing knowledge support for artificial intelligence security research.Overall,the proposed method can help address the complexity and heterogeneity of security data in artificial intelligence and provide a more standardized,integrated approach to knowledge representation and analysis.Keywords:artificial intelligence security,knowledge graph,ontology construction,information extraction,visualization 0 引言 科技是一把双刃剑,人工智能技术在推动各领域前进的同时,也引发了安全新挑战。人工智能安全问题本质是其安全赋能及伴生效应造成的,根据安全效应不同可以将人工智能安全问题分为衍生安全、助力安全和内生安全1。人工智能安全数据信息来源广泛、种类复杂并且迭代迅速,并未形成标准信息库;针对这些海量的碎片化信息进行整合处理,挖掘潜在价值并形成人工智能安全知识库,为人工智能安全防御提供知识支撑是目前科学界面临的重大问题。能够对多源异构数据进行关联挖掘的知识图谱,为解决当前人工智能安全问题提供了一种思路。知识图谱旨在实现高效搜索2,是一种更为高效的管理和利用海量数据的方式,近年常用于智能问答、情报分析、语义搜索等领域。与此同时,知识图谱的数据结构与人工智能领域许多技术任务所基于的数据一脉相承,可以为后续的智能搜索和知识推理任务提供强有力的支持。虽然目前还没有出现人工智能安全领域的知识图谱,但与其具有相互依赖性的网络安全知识图谱已经应用于网络安全分析、网络空间态势感知等领域,为人工智能安全知识图谱构建提供了借鉴。对信息安全领域中知识图谱的研究主要集中在网络安全、威胁情报、安全态势感知等方向,如秦娅等3针对网络安全知识图谱构建进行研究,在复用经典实体的基础上对海量碎片化的多源异构数据进行细粒度的分析与挖掘;Jia 等4提出一种基于机器学习的网络安全知识图谱构建方法与基于五元组模型的推演规则,将本体构建分为模式层与数据层,但本体构建核心模式层知识范围不够全面;王通等5对威胁情报进行本体建模,提出一种监督性的深度学习模型,该模型对威胁情报的实体和实体关系进行自动化抽取并可视化展示。对于知识图谱构建的关键层次本体构建,当前信息安全领域本体研究范围较为广泛且未形成统一标准,尚无人工智能安全本体可供借鉴,领域内应用较为广泛的本体有:Iannacone 等6提出的网络安全通用本体 STUCCO,涵盖 15 个实体类和 115 个属性;Qamar 等7提出针对威胁情报的本体,实现了情报信息的融合。以上工作在本体构建部分大多采用了模式层与数据层两层结构的表达和关联,知识表达能力不足,影响后期知识图谱的实用价值。实际应用于信息安全领域的知识图谱项目更少,主要有 MITRE 公司针对图模型研究的CyGraph 原型系统8,该系统将来自众多数据源的数据关联到一个规范模型中,利用 Neo4j 构建持久数据存储,对网络资产进行高性能分析并推166 网络与信息安全学报 第 9 卷 理网络攻击关系;国内的绿盟科技针对网络安全领域内

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开