基于分裂式K均值聚类的无线网络信息定向挖掘方法研究叶建德①(泉州职业技术大学,福建泉州362269)摘要:为增强无线网络信息定向挖掘效果,设计一个基于分裂式K均值聚类的无线网络信息定向挖掘方法。设定数据挖掘规则,对待处理的信息分块处理,将不同数据信息统一到数据节点中,寻找海量数据中的频繁事务,计算信息的主成分,并检索边权重,得到数据关键特征,筛选数据挖掘候选集,采用分裂式K均值聚类方法对大数据聚类,进一步计算候选集中每一类别下数据特征出现的概率,实现基于分裂式K均值聚类的无线网络信息定向挖掘。实验表明,所研究的定向挖掘算法挖掘精度高、可挖掘特征形成概率高、挖掘时间少、占用的内存少,有效增强无线网络信息定向挖掘效果。关键词:分裂式K均值聚类;无线网络信息;定向挖掘;检索;匹配;规则中图分类号:TP311.13文献标志码:A文章编号:20959699(2022)060023050引言随着信息技术的飞速发展,各种产业的信息量越来越大,人们对数据挖掘的需求也越来越大,越来越多的学者开始研究数据挖掘方法。其中,张乾坤[1]等研究了一种基于ELK框架的地理信息动态时空数据获取与挖掘方法,该方法建立动态采集机制,在信息采集的基础上,筛选信息,实现海量数据的挖掘;熊菊霞[2]等研究了异构复杂信息网络敏感数据流动态挖掘方法,通过对数据进行预分类,对敏感信息进行识别,求出最大的离散程度,再利用遗传算法对数据进行优化迭代,从而获得数据挖掘的特点。但是在无线网络信息中,会有一些隐藏信息,这些方法在一般情况下不能实现对隐藏在海量数据下的相关内容挖掘,会造成信息的丢失,信息挖掘效果不是很好。分裂式K均值聚类方法能够根据数据的特征将其映射到几个区域的特征空间内,每个样本属于一个类,每次更新获得与该类样本相关的数据,能够有效提高数据的处理效率。基于分裂式K均值聚类方法的这个优点,设计一种基于分裂式K均值聚类的无线网络信息定向挖掘方法。1基于分裂式K均值聚类的无线网络信息定向挖掘方法1.1挖掘规则制定在对无线网络中的信息数据挖掘时,预先设定数据挖掘规则,主要目的是找到海量数据中的频繁事务,即频繁项集。关联规则是一种以增长趋势为主形式的挖掘算法,主要包含候选集挖掘与挖掘数据优化两个过程,具体的挖掘规则为:⑴对待处理的信息分块处理[3],将处理后的结果输入到集群节点中,并计算每一项数据节点的支持度,支持度计算公式表示为:mj=N∑mi=1xijh(1)上述公式中,N代表数据的数量,h代表数据节点支持度计算参数;⑵对map程序执行,从网络...