一种融合标签和患者咨询文本的医生推荐算法周鑫,熊回香,肖兵(华中师范大学信息管理学院,湖北武汉430079)摘要:【目的/意义】针对在线医疗信息结构松散,医疗平台医生推荐精度不足的现状,设计了一种基于标签和患者咨询文本的医生推荐算法,提升医生推荐效果。【方法/过程】利用Word2vec模型训练患者咨询文本得到特征向量,改进余弦相似度算法计算医生推荐集A;利用LDA模型训练医生标签得到医生在主题上投影的概率分布,改进KL距离算法计算医生推荐集B;基于社会网络分析理论设计相关算法重构医生网络链接,选择中心性指标得到最终医生推荐集C。【结果/结论】以“丁香医生”数据进行实证,面向UGC数据丰富了算法的可用程度,弥补了单一推荐方法的不足,提高了推荐的精度。本文所提方法有效提升了医生推荐精度。【创新/局限】通过融合标签和患者咨询文本,采用社会网络分析实现了医生混合推荐。虽然通过中心性指标进行重要医生挖掘,但挖掘效果有提升空间。关键词:医生推荐;标签;Word2vec;LDA;社会网络分析中图分类号:G254DOI:10.13833/j.issn.1007-7634.2023.03.017收稿日期:2021-09-16基金项目:国家社会科学基金重点项目“数智驱动的在线健康资源挖掘与智慧服务研究”(22ATQ004);2022年度华中师范大学基本科研业务费(人文社科类)交叉科学研究项目“基于量化自我技术的个体健康管理研究”(CCNU22JC033)。作者简介:周鑫(1995-),男,江西吉安人,硕士研究生,主要从事网络信息组织和数据挖掘研究;熊回香(1966-),女,湖北鄂州人,教授,博士,主要从事网络信息组织和数据挖掘研究;肖兵(1993-),男,四川资阳人,博士研究生,主要从事网络信息组织和用户行为研究,通讯作者:xiaobing@mails.ccnu.edu.cn。1引言近年来在政策的扶持下,为了满足健康医疗信息用户交流、分享、合作、协调一致行动的本能需求,互联网在线医疗社区快速兴起,代表社区如“丁香园”“微博医疗”“好医生”等。医生和患者在平台中浏览诊疗信息、参与病情讨论、寻求潜在的合作和诊疗机会【1】,生成了海量却分散的健康医疗信息。这些指数式增长的信息呈现出大规模、异质多元、组织结构松散等特点,这给患者有效的信息获取和利用带来了诸多困难,因此需要对患者进行精准的医生推荐。当前大部分在线医疗社区(典型为丁香园、好医生)医生推荐的主要依据是医生“星级”“在线情况”“问诊价格”等网站指标,功能较为粗泛,推荐效果欠佳;进一步地,目...