温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
权重
特征
融合
持续
身份
认证
陶鹏
第 卷第期重 庆 大 学 学 报 年月 :自适配权重特征融合的持续身份认证陶鹏,邓绍江(重庆大学 计算机学院,重庆 )收稿日期:网络出版日期:基金项目:国家自然科学基金资助项目()。()作者简介:陶鹏(),男,硕士研究生,主要从事移动计算安全研究,()。通信作者:邓绍江,男,教授,博士生导师,主要从事信息安全、移动计算、无线传感网络等研究,()。摘要:针对现有智能手机用户身份认证方法的不足,提出了一种自适配权重特征融合的持续身份认证方法。设计了一种卷积神经网络,对手机内置传感器(加速度计、陀螺仪、磁力计)获取的用户行为信息数据进行深度特征提取及融合。通过网络中个子网络流分别提取种传感器特征,在特征融合层加权融合,各特征的权值会在网络学习过程中根据不同特征的贡献度实现自适应分配。融合特征经过特征选择之后,使用单分类支持向量机进行用户分类认证。实验结果表明:该方法对不同用户身份认证获得的等错误率为,与现有其他认证方法相比具有更好的认证准确性。关键词:持续身份认证;自适配权重;深度特征融合;卷积神经网络;单分类支持向量机中图分类号:文献标志码:文章编号:(),(,):,(,),:;();()智能手机已逐渐成为日常生活的必备工具,其存储着大量与用户个人隐私相关的信息,所带来的隐私安全问题已受到日趋重视。身份认证技术则是保护手机用户隐私安全的重要方式之一。基于行为特征的持续身份认证,是指在用户与手机交互过程中,通过手机内置传感器自动获取用户的行为信息数据,提取相关行为特征,并使用分类算法来完成对用户身份合法性的认证。该认证方式具有持续、隐式的特点,克服了传统的基于密码和基于生物生理特征等一次性身份认证的局限性,已成为身份认证研究的重点方向。目前基于行为特征的认证,大多数基于单一行为信息,如步态、触摸手势等,来提取特征用于认证,所提取的特征大多是人为设计的特征。随着深度学习的发展,卷积神经网络已被部分研究者应用于用户认证,以自动提取更具鲁棒性的行为特征。此外,信息融合技术也在基于行为特征的用户持续认证中得到了应用 ,以克服单一行为特征认证的局限性。基于信息融合的认证根据认证的流程可以分为数据级、特征级、分数级和决策级的个层级的融合。特征级融合属于中间层的融合,它突破了单一特征在噪声、数据质量差等方面的限制,能够实现多特征之间优势互补,相比其他层级的融合可以实现更高的认证准确率。文献 和文献 的特征融合均是对步态和击键行为数据分别提人工特征,并对种模态特征进行串联融合。文献 同样采取串联的融合策略,所提取特征是击键和手持种行为数据的特征。文献 对加速度计、陀螺仪、磁力计等传感器采集的行为数据提取人工特征,同时使用了串联和并联的特征融合策略。现有的基于特征融合的身份认证方法在认证性能上虽然表现出色,但在特征融合时都是融合人为设计的特征,人工特征往往只适用于研究者特定的实验环境,且产生的认证精度有限。此外,这些方法在融合策略方面仅采取简单的串联和并联方法,没有将不同特征对认证贡献度的大小考虑其中,所以基于特征融合的身份认证还有提升的空间。针对以上存在的问题,文中提出了一种自适配权重特征融合的身份认证方法,对传统的人工特征提取进行改进,设计了一种卷积神经网络提取多种传感器的深度特征,该特征具有更强的鲁棒性。在进行多特征融合时,对常用的串并联策略进行改进,设计了一种依据不同特征贡献度大小,实现自适配权重分配的融合策略,以使得融合后的特征具有更强的表现力,能够实现更有效和准确的身份认证。持续身份认证框架基于自适配权重特征融合的持续认证的系统框架如图所示。图基于自适配权重特征融合持续认证系统框架图 整个认证系统包括注册和持续认证个阶段。注册阶段主要是完成对深度特征提取和分类认证个模型的训练,在用户与手机交互的过程中,手机内置加速度、陀螺仪和磁力计传感器会自动获取到用户的行为信息数据,在经过预处理之后,输入到卷积神经网络中进行训练。该网络能够独立地提取种传感器的特重 庆 大 学 学 报第 卷征,并在网络的融合层中根据不同特征对认证贡献度大小进行自适配权重的融合,训练好的网络模型将作为特征提取模型。输出的融合特征经过特征选择之后,会输入到单分类支持向量机中进行训练得到分类认证模型。而在持续认证阶段,其他未知的用户以同样的方式获取传感器数据并预处理之后,使用预训练的特征提取和分类认证模型进行用户的身份认证。数据的获取和预处理种传感器数据的获取笔者所用传感器数据来源于用户持续认证公开数据集,该数据集的收集是通过在三星 手机上安装的数据采集工具进行的,采样频率为 。采集了 名手机用户在种使用场景下(文档阅读;文本编辑;地图导航)的行为信息数据。每个用户收集到 个会话(个阅读会话、个编辑会话以及个地图导航会话),共的数据。在剔除包含缺失或异常数据的用户之后,最终选择了 个用户中的 个,将其加速度计、陀螺仪以及磁力计传感器的前 约 样本量的数据用于实验。加速度计传感器的原始数据可以表示为d的矩阵 (,),其中d表示维度(即,轴),表示数据样本总量,(,)表示加速度计轴上数据序列,和 分别为轴和轴的数据序列。类似地,陀螺仪和磁力计传感器的原始数据表示为,(,)和 (,)。数据的预处理数据归一化为减少原始数据中噪声等异常对认证性能的影响,使用均值 标准差归一化对原始数进行处理。分别对各个传感器的每一轴数据序列(以加速度计传感器轴数据序列 (,)为例)执行以下运算:,()式中:下标表示是序列 中第个数据样本;,和 分别表示归一化之前和之后的样本;和表示加速度计轴数据序列的均值和标准差,其计算方式分别为 ,(),()。()各传感器归一化之后的数据为 (,)、(,)和 (,)。时间窗口划分对归一化之后的加速度计数据 划分时间窗口,将其划分为秒时间窗口且数据宽度为(,其中为采样频率)的片段数据,每个时间片段的数据可表示成d的矩阵(,),其中 (,)表示加速度计传感器在时间内轴上的样本,通过划分可以得到()数量的时间窗口的数据。陀螺仪传感器数据 和磁力计传感器数据 也依此方式进行划分。特征的提取及自适配特征融合在设计的用于特征提取的卷积神经网络结构中,引入了 轻量级网络框架中的基本模块()和下采样模块()。这种模块是在带有残差结构的深度可分离卷积()结构的基础上,加入通道分割()、拼接()和通道混合()等操作改进而来,相比普通的卷积,在不损失模型较大精确度的前提下,可以减少大量计算参数,适合在智能手机这种资源有限的移动设备上进行运算。基于这种模块设计了如图所示的一种卷积神经网络结构,该结构由卷积层,包含下采样模块和基本模块的阶段,包含下采样模块、基本模块和基本第期陶鹏,等:自适配权重特征融合的持续身份认证模块的阶段,卷积层,全连接层和全连接层组成,使用该网络对不同传感器数据提取深度特征。图卷积神经网络结构 为了充分利用各个传感器采集的数据,使各个传感器所提取的特征达到优势互补,需要对这些传感器的特征进行融合。笔者将特征融合功能结合到了卷积神经网络中,设计了如图所示的多传感器特征融合的网络结构,该网络将图网络作为子网络流提取个传感器的特征,在全连接层之后加入特征融合层,特征融合层将输出各传感器的融合特征向量。迭代更新融合的特征向量,以最小化网络的损失函数为目标训练模型,直到模型收敛为止。注:表示卷积层,和 分别表示 的基本模块和下采样模块,表示全连接层,、表示全连接层输出的特征向量图多传感器特征融合的网络结构 重 庆 大 学 学 报第 卷传统特征融合策略是串联和并联,即对原始多模特征进行横向和纵向连接。以双模特征向量融合为例,对于个同质向量和,特征维度分别为和,使用串联方式融合,融合后特征向量为,的形式,其维度为。使用并联方式融合,融合后特征向量为复向量(为虚数单位),融合特征的维度为和中的较大者,对于维度较低的向量融合后相应位用补位。并联和串联的融合策略将原始特征重要性同等看待,没有考虑不同特征对认证结果的贡献度大小。文中对每个子网络流输出的传感器特征乘以一个自动分配的权重系数,通过这种方式,在网络迭代的过程中,自动地根据贡献度大小为传感器特征分配自适应的权重系数。每个子网络流中的传感器特征都在特征融合层以公式()的前向和公式()的反向传播的方式进行迭代:前向传播:,()反向传播:,()式中:和 表示特征融合层每个子网络流的输入和输出;表示权重;和 分别表示损失函数对 和 的偏导数。在网络训练阶段,将各模态传感器的权重初始化为,经过自动学习,具有不同权重的传感器特征会形成融合特征:,()式中:、和是每个传感器的自适配权重;、和分别为个传感器提取的初始深度特征向量和融合深度特征向量,维度均是。网络中选用的损失函数是交叉熵损失函数,具有如下的形式:(,),()式中:是传感器数据对应的用户标签;是用户的数量,为;是第二个全连接层的输出,可以表示为(),()式中:和是第二个全连接层的权重和偏差。分类与认证分类器训练在提取深度融合特征之后,对所有用户进行分类训练。采集的行为数据中均为合法用户数据,缺少非法用户数据。对于这种正负样本失衡的分类问题,笔者使用单分类支持向量机(,)作为分类器。单分类支持向量机算法,类似于将零点当做负样本点,其他数据点作为正样本点进行训练的二分类支持向量机。具体策略是将数据映射到与内核对应的特征空间上,在数据和零点之间构建超平面,并最大化零点到超平面的距离。训练过程中选用径向基函数(,)作为核函数,并使用网格搜索法的方式进行超参数的选定。用户认证在深度特征提取融合的网络模型训练之后会生成深度特征提取融合模型,单分类支持向量机训练之后会生成用户认证模型。在认证阶段,用户使用手机期间种传感器实时采集的行为数据经过预处理之后,输入深度特征提取融合模型,然后将输出的融合特征输入用户分类认证模型中,完成对用户身份合法性的判断,当检测到非法用户时,将进行重新认证或异常处理。实验分析认证性能评估指标文中后续实验使用以下常用的持续认证系统的评估指标。错误接受率(,)表示认证系统将非法手机用户错认为是合法手机用户的概率,第期陶鹏,等:自适配权重特征融合的持续身份认证计算公式如式()所示,其值越小,表示认证系统越不会接受非法用户,安全性越好。,()式中:表示系统错误地将非法用户当成合法用户;表示系统正确地拒绝了非法用户。错误拒绝率(,)表示认证系统将合法手机用户错认为是非法手机用户的概率,计算公式如()所示,其值越小,认证系统越不会拒绝合法用户,易用性越好。,()式中:表示系统错误地将合法用户当成非法用户;表示系统正确地识别了合法用户。等错误率(,)是错误接受率和错误拒绝率相等(即 )时候的值,是认证系统的综合评价指标,其值越小表示认证系统整体性能越好。深度融合特征的选择种传感器的特征经过自适配权重的特征融合之后形成了 维的高维深度融合特征,高维特征不仅影响分类效率,而且其包含的噪声对分类认证性能有较大影响。文中选用主成分分析法(,)对深度融合特征进行选择,以为步长,探究选择的不同特征数目下的认证的等错误率,其结果的箱型图如图所示。从图可以看出,整体上随着选择的特征数目的增加,等错误率的均值逐渐降低并在 时达到一个最低值,之后等错误率的均值随着选择特征数目的增加而缓慢地增加。因此,选择 作为最终用于认证的深度融合特征的数目。图不同数目的深度融合特征认证的等错误率 时间窗口大小的选定时间窗口的大小决定了输入数据量的大小,对认证性能有着重要的影响。笔者研究了,以为间隔的时间窗口大小下认证的性能,结果如图所示。可以看出,随着时间窗口大小的增加,等错误率均值逐渐下降,在后,下降趋势变得平缓。时间窗口的大小同时也决定了认证的时间间隔,影响用户体验。在综合考虑认证性能和用户体验之后,将时间窗口大小设置为,并在后续实验中默认使用这一设置。重 庆 大 学 学 报第 卷图不同时间窗口大小认证的等错误率 与人工特征及串并联融合的比较为了验证文中提出的卷积神经网络进行深度融合特征提取,以及使用自适配权重特征融合策略的有效性,分别进行了串联融合策略下深度和人工特征提取的认证(记做串联方案)