随着信息化的高速发展,研究复杂关系型数据统计性质的网络科学正在兴起.如果将一个网络视为由节点与边构成的拓扑图,某些子图出现内部连接密集,而在外部连接稀疏的情况,即“高内聚,低耦合”,则通常认为其存在较为紧密的聚类关系,进而将这些子图称为一个社区.社区发现是网络科学的重要研究方向,对探索网络的特性、揭示网络潜在规则和改善网络行为具有指导性作用.标签传播算法(la⁃belpropagationalgorithm,LPA)[1]作为社区发现中的主要算法应运而生,基于信息传播的思想,同时具备时间复杂度低、所需网络结构的先验信息少等优势,但同时也存在因为标签更新过程中随机度过高而导致的准确率不高、迭代结果不稳定的问题.针对上述问题,学者们提出了多种改进算法,一般思路是改变原算法中的随机传播策略,通过度量节点重要性进行传播顺序的优化.翟镇新等[2]提出LLPA算法,引入LeaderRank算法计算节点影响力,减少资源“逆流”;贾慧娟等[3]提出COPRA-S算法,计算节点连接社区强度,通过桥梁节点的设计,防止标签过度传播;Lu等[4]提出LPANNI算法,度量邻居节点影响力NNI作为定义标签更新顺序的依据.以上算法均未考虑邻域相似度对设计标签更新顺序规则的重要性.本研究受到LLS[5]度量指标的启发,提出一种基于节点度与节点邻域相似度的标签传播算法(locallinksimilarity-labelpropagationalgorithm,LLS-LPA),通过量化邻域网络中的重叠率与节点度值,生成新的节点标签更新规则,引入标签传播算法可解决随机性过高的问题.通过在不同数据集上的实验结果表明,LLS-LPA算法在一定程度上消除了随机传播策略对社区划分精度的影响,提升了网络中信息传播的有效率.1标签传播算法标签传播算法是基于图结构数据的半监督式学习算法,用于寻找网络中存在的社区,其基本思想是利用网络中的拓扑结构信息,采用信息传播的方式,不断在目标节点和邻居节点中传递标签信息,在完成一次传递后根据多数原则更新所有节点的标签,反复迭代,直至算法收敛得到社区划分结果.其更新节点度与邻域相似度标签传播算法林欣,吴玉芹,冯玮,范业仙*(宁德师范学院信息与机电工程学院,福建宁德352100)摘要:标签传播算法是一种典型的社区发现算法,针对其传播过程中存在由于随机性过高而导致的准确率不高、迭代结果不稳定等问题,提出基于节点度与邻域相似度的标签传播算法,对传播策略进行改进,引导算法进入良性的路径依赖中.在真实网络和人工网络中的实验结果表明,基于节...