Application创新应用160电子技术第52卷第2期(总第555期)2023年2月前广泛应用的低秩矩阵分解方法包括主成分分析、奇异值分解、非负矩阵分解等。1研究背景由于观测噪声和数据缺失情况的存在,概率的方法被引入到低秩矩阵分解中,在2007年Salakhutdinov[1]等人提出概率矩阵分解(Probabilitymatrixfactorization,PMF)方法,假设观测值和预测值的误差服从正态分布,常用最大化后验概率求解模型。虽然MAP估计只需要温和的条件就是贝叶斯估计的一个特殊情况,但是它不能很好地代表贝叶斯方法。由于MAP估计是点估计,而贝叶斯方法的特征在于使用分布来总结数据和推论。Salakhutdinov[2]等人就在20080引言高维数据在现代社会生活中普遍存在,并且随着信息化技术的发展在不断增长,数据库规模越来越大、复杂性越来越高,如各种类型的贸易交易数据、Web文档、基因表达数据、文档词频数据、用户评分数据、Web使用数据及多媒体数据等,它们的维度通常可以达到成百上千维,甚至更高。处理高维数据是一个耗时的过程,需要大量的资源,这种高维数据不仅增加了算法的计算开销和内存需求,而且影响了算法在实际应用中的性能。实际应用中收集的高维数据往往包含几个相互相关的变量,这些变量都是潜在特征的组合,近似低秩矩阵分解是提取这些潜在特征的基本方法。目基金项目:福建农林大学科技创新专项课题(CXZX2020105A)。作者简介:潘雨婷,福建农林大学计算机与信息学院,硕士研究生;研究方向:信息技术、智能算法应用。通信作者:滕忠铭,福建农林大学计算机与信息学院,副教授,博士;研究方向:智能算法应用。收稿日期:2022-10-19;修回日期:2023-02-12。摘要:阐述概率矩阵分解(PMF)广泛被应用于预测缺失值和数据聚类,它把观测数据看成是一个基矩阵和权重矩阵的乘积,这可能会降低模型的灵活性。目前常见的是高斯分布为先验的概率模型,但是高斯分布对于异常值比较敏感,而采用t分布先验的模型能减轻异常值的影响,具有更好地稳健性。为了提高模型的灵活性和稳健性,提出了t分布先验的概率矩阵三因式分解(TBMTF),将观测数据看成三个相互约束的潜在特征矩阵的乘积,假设噪声服从t分布,变分贝叶斯推断进行参数估计。相较于传统的PMF方法,TBMTF方法能更好地识别异常值并做出预测。基于人为数据和真实数据的实验表明,在人为数据的预测效果与真实数据中添加噪声后的预测效果,都表现优秀。关键词::概率矩阵三因式分解,t分布,变分贝叶斯,缺失值...