分享
核支持向量的主用户活动场景分类算法_张红.pdf
下载文档

ID:492926

大小:1.81MB

页数:9页

格式:PDF

时间:2023-04-05

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
支持 向量 用户 活动 场景 分类 算法
第 卷第 期重庆邮电大学学报(自然科学版)年 月 ():核支持向量的主用户活动场景分类算法收稿日期:修订日期:通讯作者:申 滨 基金项目:国家自然科学基金():()张 红,申 滨,方广进,崔太平(重庆邮电大学 通信与信息工程学院,重庆)摘 要:针对认知无线电网络中传统频谱感知方法性能不足以及空白频谱利用率较低的问题,提出了一种基于核支持向量的主用户活动场景分类算法,通过判断地理区域内的活动主用户数量及分布情况来提高获得潜在频谱接入机会的可能性。根据核支持向量的边界对主用户活动场景作初分类处理,由此判定当前网络中的活跃主用户发射机的数量。初分类处理既能减少支持向量中矩阵计算量,也能减少人工标记数据所带来的成本。再对每一个初分类处理后的数据进行无监督聚类,从而得到实际对应的主用户活动场景细分类。实验结果表明,所提算法与直接使用核支持向量分类算法相比,不仅改善了频谱感知的性能,同时还大大降低了定标成本及时间成本。关键词:频谱感知;机器学习;核支持向量;场景分类中图分类号:文献标志码:文章编号:(),(,):,()(),:;引 言认知无线电(,)作为一种解决当前无线通信中频谱短缺和某些授权频段(,)利用率低下问题的重要技术,通过实时监控频谱的占用情况以伺机实现机会性访问,由此提高频谱利用率。为了确保对主用户(,)的干扰尽可能小,次级用户(,)需要具有环境认知功能,必须能可靠地感知频谱状态,即检查 是否正在使用该频谱,以便利用不同时空下的频谱空洞状态。传统的频谱感知方法可分为本地频谱感知和合作频谱感知。本地频谱感知以能量检测(,)为典型算法,该算法计算复杂度小且易实现,无需 先验知识。但是,该算法容易受到噪声的干扰,且在 接收信噪比较低时,很难观测到 信号;另外,能量检测的判决门限往往是根据噪声的方差来确定,然而在实际情况下,精确地估计噪声方差较为困难。集中式合作频谱感知利用多个 的合作,能有效地提高频谱感知的可靠性及检测概率。然而,这类方法通常需要 信号和无线传播环境的各种先验知识,在现实中可能很难实现。基于机器学习分类器的频谱感知(,)算法对于数据分类有强大的处理能力,相对于传统信号处理框架下的典型频谱感知方案可能具有更优的性能。作为一种受大量数据驱动的频谱感知解决方案,方法受到广泛关注和推动。在 范畴内,支持向量机(,)是一种有坚实理论基础的机器学习算法,它的最终决策函数只由少数的支持向量(,)所确定,计算复杂度取决于支持向量的数目,而不是样本空间的维数。文献研究了在不同核函数参数和不同样本数据维度下 分类的性能,相比于能量检测的性能更好。然而,该算法不适合多分类任务且在样本数据维度较高时性能较差,无法避免 在处理数据量较大时对应的训练时间过长的问题。文献研究了对 个 活动场景的分类,通过一对一和一对多的多分类 来解决。但是该算法解决的场景较为简单,性能会随着 数目的增加而下降,原因是存在较多 时,分类场景的相似度较高,在低信噪比下不易区分。针对以上算法的不足以及考虑到在现实情况下训练 的数据标签难以获得的问题,本文提出了基于核支持向量的主用户活动场景分类算法,该算法通过判断地理区域内的活动 数量及分布情况,即不同的 活动场景。再由 根据其自身所处地理位置或者频谱观测数据,判断在当前已判定的 活动场景下接入授权频谱的可能性。相比之下,传统的感知算法(门限检测)一旦检测到 处于活跃状态,则拒绝 有任何接入授权频谱的机会;而在本文算法中,当 距离 位置足够远,该算法能够尽可能地获得潜在的频谱接入机会。此外,本文的场景分类方案在算法本质上是以目标区域内的 信号能量分布为基础的,这与传统的能量感知算法仅仅局限于自身的接收信号能量值进行二元假设判决相比,可以较大程度地提高感知性能。本文提出算法的主要过程:首先,对大量频谱观测数据进行一对一多分类辨识,根据支持向量的边界对主用户活动场景作初分类处理,由此判定当前网络中的活跃主用户发射机的数量。由于不同数量的主用户活跃场景之间区别度较高,初分类处理既能减少支持向量中矩阵计算量,也能减少人工标记数据所带来的成本,然后,再对每一个初分类处理后的数据进行无监督聚类,最后,得到实际对应的主用户活动场景细分类。实验结果表明,所提算法与直接使用核支持向量分类算法相比,不仅改善了频谱感知的性能,可进一步增加 在 中的机会性接入可能,同时尽可能降低所耗的时间成本。系统模型 场景模型考虑在蜂窝认知无线电网络(,)中存在若干个 设备和 个 发射机(,)。在 上的工作状态可以标记为 和 种,因此,网络中总共存在 个 活动场景。在本文中令()(),(),()代表第 次频谱观测所对应的 个 联合工作状态,将其定义为 活动场景,其中,()表示第 个 处于活跃传输状态;()表示其处于空闲状态。表 给出了存在 个 时的活动场景,且 之间的工作状态互相独立,对应这 类的能量分布场景模型在图 中给出。表 个 的活动场景类别定义 初分类场景细分类场景 重 庆 邮 电 大 学 学 报(自然科学版)第 卷图 下 活动场景模型 信号模型为了进一步增加 接入 的机会,将 划分为 个等面积的网格,则第 个网格中的 接收到的信号表示为,()()式中:接收信号 ,是 观测到的数据总数;(,)表示均值为、方差为 的加性高斯白噪声,和 分别为所有的 都处于空闲状态和至少有一个 处于活跃状态的假设,亦即前面定义的活动场景。值得说明的是,这种假设状态除了表征 是否活跃外,还包括了 活动的具体位置信息。是接收信号中包含的 有效信号成分,第 次观测的频谱数据表示为 ,()()()()()式中:,表示第 个 的传输功率;()为第 个 的传输符号;()为第 个 到第 个 的信道系数,表示为()()()()(,)()()()()式中:,和,分别表示第 个 的位置坐标和第 个 的位置坐标,(,),是第 个 到第 个 的传播路径功率损耗;()是相对于第 个 信号的阴影衰落;()是多径衰落复合因子。根据()式,个 在第 次观测到的信号为,。在 中,依靠在足够长的时间内收第 期 张 红,等:核支持向量的主用户活动场景分类算法集的频谱数据,可以得到用于 活动场景分类的数据集 ,()基于传统算法的 活动场景分类 能量匹配算法基于经典的能量检测算法,本文提出一种适用于多分类的能量模板匹配(,)算法。构造能量模板 为 ,()()式中:为 发射机个数,其中第 个带有标签 的能量样本 为,()测试数据 的能量样本 通过与能量模板 进行匹配搜索得到最终的分类标签 ,()()式中:标签 对应某一个 活动场景。线性可分 是一种有着较强泛化能力的分类器,其分类目标是对特征空间划分以得到最优超平面,核心是最大化分类边界,可表示为,(),()()式中:(,)是要寻找的最小分割面,是分割面的法向量,是位移项。其分类模型为()(),(),()()()式中:表示正类;表示负类。然而在现实任务中,低信噪比下的频谱观测数据在原始样本空间的分布并不理想,图 为本文样本数据在 下的二维分布图。为了能提高低信噪比下场景分类的识别率,采用了基于核函数的 进行场景分类,它能将低维空间中的样本数据投影到更高维的空间中,从而使得样本分布更易于区分,如图 所示。图 不同维度下数据的分布 基于核 的 活动场景分类 基于核 的 活动场景初分类基于核函数的 可以将样本从原始空间映射到一个更高维的特征空间,使得原始空间内线性不可分的样本在高维的特征空间内线性可分。但是直接利用基于核 对 活动场景分类忽视了样本间的相似性。随着 数量的增多,这种相似关系会大大影响分类结果,并且在实际情况中,获得所有数据的标签是非常困难的。因此,考虑到样本间的相似性和标签难以获得 个问题,本文首先对 个 活动场景利用核 进行分类,即分为,个 活跃的场景,其中,对应没有 活跃的场景,即 ;,表示在网络中不同位置的单个 活跃的场景;,表示同时有()个 活跃的场景;表示 个 都处于活跃的场景,即。给定训练样本 重 庆 邮 电 大 学 学 报(自然科学版)第 卷,以及其对应的标签 ,测试数据 ,其中标签分为()组,分别对应某一个 活动场景,。通过非线性变换 将 映射到高维特征空间中,在该特征空间中寻找分类超平面,目标函数表示为,(),()()式中:是允许软边界的一些松弛变量,是惩罚因子。为了解决该优化目标,引入拉格朗日函数 ()()()式中:和 代表拉格朗日乘子。相对于 和 求导,最小化 得到归一化条件 ()()利用上述关系,可以消除变量 和,将拉格朗日方程转化为 对偶问题,其仅是变量 的函数,(,)()(),()()式中:映射关系()()可以用核函数来替换,常用的核函数有线性核:(,);多项式核:(,)(),为多项式的次数;高斯径向基核:(,),其中,是高斯核宽度参数。根据以上设定,问题()可重写为()(,),()问题()可通过序列最小优化算法(,)来迭代更新 直到找到最优的。首先假设 仅是任意 个未知数 和 的函数,其余参数都固定,则()()()式 中 (,),为常数。和 满足条件 ()由于()式右边与 和 无关,因此可记为常数,。由此可找到 或 的极值情况 (,),(,)(,),(,)()然后,将 用 表示为()()将其代入()式,得到关于 的单变量函数()()()()()该式相对于 求导后,化简得更新公式()()()式中:()表示第 次迭代的误差。结合 的约束,得到最后的更新公式,如果 ,如果 ,如果 ()由此,()。注意到对任意支持向量(,)都有()()()式中:为所有支持向量的集合。可由求解所有支持向量的平均值得到第 期 张 红,等:核支持向量的主用户活动场景分类算法 ()()式中:为集合的势。于是分类模型可写为()()(,)(),(),()()()式中:表示正类;表示负类。本文采用一对一核 进行训练,得到()个分类器。在测试阶段,一对一核 多分类的结果由投票产生,把预测得票最多的类别作为最终分类结果,如表 所示。样本 经过 个分类器分类后,得到的预测结果中 最多,于是经过投票,将最多的那一类场景 作为样本 的最终预测结果。表 一对一多分类器的分类规则 类类分类器预测结果最终预测结果 基于聚类的 活动场景细分类对 个不同 的活动场景利用核 初分类为,个 活跃的场景,由于和 只包含一种最终场景类别,因此无需再分类,即 对应,对应。在初分类的基础上,仍需进一步分别对,个初类利用聚类方法再次细分类。假设在场景,类中存在 类样本集合,聚类目标为聚类得到的 个子集满足类内的误差平方和最小,因此,确定目标函数为 ()()式中:()为聚类中心()()式中:为第 类集合中的样本数。对于该目标函数的求解是一种 问题,因此,采取迭代优化的方法,其主要步骤如下。步骤 取聚类中心数目,随机选取一个聚类中心,定义为 ,令为样本间的距离,通过迭代计算最大概率值为 ()加入下一个聚类中心,直至完成 个聚类中心的初始化。步骤 在第 次迭代中,分配样本集各元素 到相近的聚类集合,其分配依据为 ,()步骤 根据步骤 中结果,进一步生成如下新的聚类中心,即()步骤 直至均值向量的变化限定在一个很小范围内,算法结束,输出簇划分结果,对应场景,。下面给出了基于核支持向量的主用户活动场景分类算法的伪代码。输入:训练集(,),(,),(,),测试集,输出:监督式核 初分类)(,:);(,:);(,:);(,:)标签为 ,的数据作为监督式核 的训练集,分别对应的场景是,)(,)网格搜索寻找最优的参数 和,参数 为核函数类型,为惩罚因子,为多项式核中的参数 或高斯核中的参数)(,)非监督式细分类)(,:);(,:);标签为,的数据作为聚类的训练集,其中,包含场景,包含场景,),(,):(,)(,)(,)(,:)(:,:);(,);,();重 庆 邮 电 大 学 学 报(自然科学版)第 卷 (,);(,);(,);(,);(,);(,);)输出:对应某一类场景,仿真结果及分析在本文中,假设目标地理区域中存在 个,对应 种可能的 活动场景,其位置分别在 ,。将 网络覆盖的 的区域划

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开