长沙民政职业技术学院学报JournalofChangshaSocialWorkCollegeVol.30No.1March.2023第30卷第1期2023年3月基于税收数据的协同过滤推荐算法设计与实现张作玲123(山东经贸职业学院,山东潍坊261011)摘要:针对商品流通环节采购商与供应商信息不对称问题,采用现阶段主流的协同过滤推荐算法设计个性化推荐方案,为供应商匹配“资信良好”的采购商信息,为采购商提供“质优价廉”的供应商信息,有效沟通供求双方需求。文章首先介绍了基于税收数据进行协同过滤推荐算法设计的必要性,然后设计了基于近邻的协同过滤推荐算法,分别论述了基于用户的协同过滤和基于物品的协同过滤;为克服数据稀疏问题,进一步设计了基于模型的协同过滤推荐算法,通过隐语义模型构建User与Item的关联,详细阐述了基于用户相似度的IncrementalSVD推荐算法实现过程,丰富了个性化推荐的应用场景。关键词:个性化推荐;协同过滤推荐算法;隐语义模型;税收数据中图分类号:TP391文献标识码:A文章编号:1671-5136(2023)01-0117-08生产要素是资源,但资源却不一定是生产要素[1]。数据作为一种新型生产要素,其价值的释放在于通过分析挖掘技术建立起数据间的关联关系[2],将数据资源转化为现实生产力。孤立静止的数据是没有价值可言的,税收数据尤其是增值税发票数据能够对纳税人的生产经营活动进行全链条、立体化的正向追踪和反向溯源,具有时效性强、覆盖面广、颗粒度细的优点,能够对纳税人的生产经营活动进行全链条跟踪,为基于协同过滤的个性化推荐奠定了数据基础。“金税四期”已经开启了“千人千面”个性化定制的道路,在决策指挥端“重大事项”模块,已经能够根据税务人员岗位、职务、偏好等数据进行差异化的信息资源推送,有效提高了工作人员信息获取的效率和质量。随着“金税四期”建设的深入推进,完全可以站在纳税人的角度,为纳税人提供“千企千面”的个性化定制服务,向纳税人推送其可能感兴趣的原材料供应商和潜在的商品采购商,一方面帮助采购商获取“质优价廉”的原材料,另一方面向供应商推送“资信良好”的潜在客户信息,在供应链环节实现优胜劣汰的生物进化,优化要素资源配置。基于此,本文运用协同过滤推荐算法设计基于税收数据的个性化推荐方案,将数据要素转化为现实生产力。1协同过滤推荐算法协同过滤利用了两个非常朴素的哲学思想:“群体的智慧”和“相似的物体具备相似的性质”[3]。从概率上讲,大多数人的决策要比单一个体的决策更为理性和高效...