基于
自适应
神经
模糊
推理
医疗
数据
风险
访问
控制
研究
国庆
收稿日期:2022-08-11基金项目:劳动能力鉴定业务管理信息系统研发及应用(2017RKX09)作者简介:于国庆(1972-),男,山东潍坊人,大学本科,硕士,副主任医师。基于自适应的神经模糊推理的医疗大数据风险访问控制研究于国庆1,沈 飞2(1.潍坊市人事考试和劳动能力鉴定中心,山东 潍坊 261041;2.山东省人力资源和社会保障厅,济南 250014)摘 要:针对传统风险预测方法预测精度低,导致医疗大数据风险访问控制效果不佳的问题,提出构建一个基于自适应神经模糊理论的风险轻量化模型。首先,对 BP 神经网络的基本原理进行具体分析;然后在 BP 神经网络的基础上,结合模糊理论知识和 T-S 模型特性,构建一个基于 T-S 的模糊神经网络模型;最后通过此模型对访问风险进行量化处理,并根据访问控制策略判断是否授予访问权限。仿真结果证明,构建的模型预测结果与实际输出结果误差均值小于 le-5;在非法用户的比例小于 15%时,基于自适应神经模糊理论的风险轻量化模型的精确率和召回率较高。由此说明,该模型在医疗大数据风险访问控制中具有可行性。关键词:医疗大数据;神经网络;模糊推理;风险访问;T-S 模型 中图分类号:TP273 文献标识码:A DOI 编码:10.14016/ki.1001-9227.2023.01.115Research on risk access control of medical big data based on adaptive neuro fuzzy reasoningYU Guoqing 1,SHEN Fei 2(1.Personnel Examination and Labor Ability Appraisal Center of Weifang,Weifang Shandong 261041,China;2.Human Resources and Social Security Department of Shandong Province,Jinan 250014,China)Abstract:In view of the problem that the low prediction accuracy of the traditional risk prediction method causes the poor medical big data risk access control effect,a risk lightweight model based on the adaptive neurofuzzy theory is proposed.Firstly,the basic principles of BP neural network are analyzed specifically;then a fuzzy neural network model based on T-S is constructed based on BP neural network by combining with fuzzy theoretical knowledge and T-S model characteristics.Fi-nally,the access risk is quantified and determines whether access permission is granted according to the access control strate-gy.Simulation results show that the mean error of the constructed model prediction result and the actual output is less than le-5;when the proportion of illegal users is less than 15%,the risk lightweight model is less than 15%.This shows that the proposed model is feasible in medical big data risk access control.Key words:medical big data;neural network;fuzzy reasoning;risk access;T-S model0 引言随着互联网和计算机技术的飞速发展,计算机领域和医疗领域的医疗大数据暴增,使得医疗数据面临着极大的威胁和挑战。其中,医疗大数据与人们的日常生活息息相关,其关乎到人们的身份信息和私密信息,网络黑客和非法分子的非法入侵和攻击,使得医疗数据的泄露问题日渐严重。因此,为了更好地服务人民,要加速推动医疗数据的隐私保护。国内外学者在医疗大数据隐私安全问题上,也进行了大量研究。例如,赵剑等提出了一种新的双区块链模型,将用户的个人信息表和交易记录分开,使用户数据隐私得到保护,还将交易链数据进行单独处理,提高医疗数据共享性。该模型不仅保护了用户的个人隐私,还有效做到了数据共享1;李洪晨等构建了基于区块链的医疗大数据信息保护模型,通过 PBFT 共识算法保证数据不被篡改,而非对称加密技术可保证个人信息的安全性,解决了医疗大数据信息的存储、保护问题,推动了区块链技术在医疗健康领域的发展2;石金秀等将零信任思想和可动态连续访问的UCON 模型结合,提出了基于零信任和 UCON 的医疗大数据访问控制模型,该模型与传统模型相比,可降低医疗大数据中的过度访问问题,保证医疗大数据共享的信息安全3。以上学者的研究,在一定程度上都保护了用户的个人信息,并且推动了数据的共享,但是从风险的角度出发,对医疗大数据的安全与隐私保护研究仍然在探索阶段。本次研究将在此基础上进行创新,构建基于自适应的模糊神经网络模型,对风险进行量化,实现对医疗大数据的动态预测。511自动化与仪器仪表2023 年第 1 期(总第 279 期)1 基本方法神经元的连接组成了神经网络,不同算法可得出不同的神经网络。BP 神经网络属于典型的前馈神经网络,其由输入层、隐含层以及输出层所组成。BP 神经网络在自适应、优化、图像处理等众多领域都有所应用,其应用广泛4。图 1 前馈神经网络结构示意图图 1 为 BP 神经网络结构示意图,其中的圆圈表示神经元节点。在 BP 神经网络中,由于上一层的神经元会作为下一层神经元的输入,因此,可依据上一层的误差值对再上一层的误差值进行计算,然后再对神经元的权值系数不断进行调整,直到最终误差值被接受。图 2是神经元结构。图 2 神经元的结构模型示意图图 2 中,x1,x2,xj表示神经元 i 的输入,wi1,wi2,wij表示神经元 j 到 i 的权值系数,Yi表示神经元 i 的输出量。2 基于 T-S 模型的模糊神经网络模型构建2.1 模糊理论模糊理论的运用是将清晰的数据映射到模糊集中,映射成实值。模糊化就是求出这个实值在几个模糊子集中的隶属度。因此,模糊理论的核心是数据的模糊化处理5。模糊理论在模糊系统中依据隶属度函数完成模糊化处理。模糊理论实质上是在模糊集中寻找隶属规律,而模糊化的关键是对隶属函数的确定。隶属度函数的确定模糊推理系统可以依据输出类型分为两类:一类为 Mamdani 模型,另一类为的 Takagi-Sugeno 模型,简称为 T-S 模型6。两类模型的主要区别是规则库的后件。基于 Mamdani 模型的模糊推理系统虽然规则表达容易被接受,但是计算相对复杂。而基于 T-S 模型的模糊推理系统中,是把去模糊化和模糊推理相结合计算得出最后的精确数值。该系统推理计算规则简单,还可和其他方法相结合,对医疗大数据隐私泄露的风险进行量化,这是一个复杂的过程,计算量大,充分考虑后,将选择基于 T-S 模型的模糊推理系统。2.2 基于 T-S 模型的模糊神经网络结构在借助模糊推理系统对知识提取时,自主学习能力不足,而神经网络的自主学习能力和容错能力较强。因此,可将两者相结合处理一些不确定、无模型、非线性等问题7。因此,将基于 T-S 模型的模糊推理系统与神经网络相结合,构建出一种基于自适应神经模糊理论的风险轻量化模型。对网络的输入向量进行设置,设 X=x1,x2,xnT,n 表示输入变量的个数,每个输入变量都将经过模糊化处理后分到不同模糊子集10。覆盖 xi的模糊子集有 mi个,则模糊集集合为 F(xi)=A1i,A2i,Amii,由此,可根据输入变量和相应的隶属度函数得到不同的模糊规则 RK8。模糊系统的输出结果Y可根据给定的输入向量以及所对应的模糊规则计算得出,其表达式如下:Y=MK=1kykMK=1k=MK=1kyk(1)式中,输入向量对每条规则的适应度表示为:k=uAj1(x1)uAj2(x2)uAj3(xn)(2)据此定义设计的模糊神经网络结构图,如图 3 所示。图 3 基于 T-S 模型的模糊神经网络模型图 3 中,前件网络一共包括四层,第一层用于接收输入变量,第一层的节点数为 N1=n9;第二层将接收的输入变量进行模糊处理后,并计算各变量的隶属度函数,该层的节点数 N2=ni=1mi;第三层作用是训练模糊规则前件,每个节点都代表一条规则,节点数 N3=M,;第611基于自适应的神经模糊推理的医疗大数据风险访问控制研究 于国庆,等 四层的作用是根据前件进行归一化处理,节点数 N4=N3。后件网络共三层,第一层的作用是接收输入变量,并将变量传输到第二层;第二层共有 M 个节点,每个节点代表一条后件规则;第三层对应系统的输出10。借助神经网络实现了模糊处理的环节,构建的模糊神经网络可对数据隐私泄露风险进行量化。影响医疗大数据隐私泄露的关键指标包括三部分,分别是用户的信任度(UT)、用户访问医疗记录的熵(EATMR)和用户选择目标的熵(EFCWO)。可设输入向量 X=x1,x2,x3T,输入变量的模糊集分为非常低(VL)、低(L)、中等(M)、高(H)四类。医院中的大部分用户的 EFCWO、EATMR 及 UT 分布在均值附近,依据数据分布特点,将假设输入变量的隶属度函数为高斯型11,即:uji=e-(xi-cij)22ij(3)式中,cij和 ij分别表示隶属度函数的均值和标准差,最终的输出变量 Y 是规则后件 yk的加权平均值。可将图3 简化为图 4,这时前件网络的输出变成连接权12。图 4 基于 T-S 模型的模糊神经网络简化结构图设神经网络的学习代价函数 J=12rl=1(Hl-Yl)2,函数表示输入 r 组向量,每一组输入向量的期望输出为Hl,实际输出为 Yl,将用梯度下降法求出 minimizeJ 13。先对代价函数 J 求出关于 wk i,cij,ij的一节导数,然后再根据梯度下降法得到各参数的学习结果为:wlki(t+1)=wlki(t)-Jwlki(4)clij(t+1)=clij(t)-Jclij(5)lij(t+1)=lij(t)-Jlij(6)在学习过程中,模糊神经网络依据提前设定好的输入输出数据,进行参数学习,并不断调整参数大小,控制误差值。上述从模糊神经网络以及算法原理上介绍了一种基于自适应神经模糊理论的风险量化模型,可对医疗大数据隐私泄露的风险进行量化。而量化后,需要依据风险值实施访问控制策略,下面将对风险访问控制的实施做具体介绍。2.3 风险访问控制实施框架基于风险的访问控制技术包括风险量化和访问控制实施两个部分组成,属于自适应访问控制技术中的一种。在对访问风险进行量化后,再由访问控制策略判断是否授予访问权限。由于传统的访问控制实施方案的判定结果不能灵活的应对医疗中的突发情况。因此,对其进行改进,引入部分允许这一概念,设置一个弹性区间,依据风险值的大小划分出不同的风险带,设置访问权限14。如图 5所示,硬边界表示用户的访问风险超出系统范围,拒绝用户访问;软边界表示在用户进行访问时,其访问风险值与软边界的边界值和硬边界同