温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
机器
学习
开放
创新
社区
创意
识别
方法
研究
水晶
包 装 工 程 第 44 卷 第 8 期 72 PACKAGING ENGINEERING 2023 年 4 月 收稿日期:20221126 基金项目:天津市教委科研计划项目(2021KJ082)作者简介:薛水晶(1994),女,博士生,主要研究方向为开放创新社区群智涌现机理及度量方法。通信作者:张静(1984),女,博士生,副教授,主要研究方向为开放创新社区用户需求挖掘与创意识别方法。基于机器学习的开放创新社区创意识别方法研究 薛水晶1,郭伟1,2,连文涛1,张静2(1.天津大学 装备设计与制造技术天津市重点实验室,天津 300350;2.天津仁爱学院,天津 301636)摘要:目的目的 探索基于机器学习的开放创新创意识别方法,解决创意识别过程中存在的耗时长、效率低、成本高等问题。方法方法 从用户特征、用户参与度和创意内容特征三个方面构建评估模型,以 OpenIDEO社区为研究对象,采集数据并进行数据清洗和数据转化映射,最后进行多种机器学习算法的参数优化,并以 F1 值为选择标准,选择分类效果最佳的算法作为分类模型。结果结果 运用 KNN、SVM、决策树、随机森林四种机器学习算法分析 OpenIDEO 数据,随机森林算法通过参数优化取得了最大的 F1 值(0.919 09),同时对于验证数据,该算法同样可以取得较好的分类效果。结论结论 应用机器学习方法对开放式创新社区中的创意进行识别,具有较高的可行性和有效性,可以大大降低社区在创意筛选中的投入,提高创新效率,优化社区生态。关键词:开放创新;创新社区;创意识别;机器学习 中图分类号:TB472 文献标识码:A 文章编号:1001-3563(2023)08-0072-09 DOI:10.19554/ki.1001-3563.2023.08.007 Machine Learning-based Method of Creative Identification in Open Innovation Community XUE Shui-jing1,GUO Wei1,2,LIAN Wen-tao1,ZHANG Jing2(1.Tianjin Key Laboratory of Equipment Design and Manufacturing Technology,Tianjin University,Tianjin 300350,China;2.Tianjin Renai College,Tianjin 301636,China)ABSTRACT:The work aims to explore a machine learning-based method of creative identification in open innovation to solve a number of problems in creative identification,including long time consumption,low efficiency and high costs.An evaluation model was built at first in light of user characteristics,degree of user participation and creative content char-acteristics,followed by focusing research on OpenIDEO Community,collecting data,conducting data cleansing and data conversion mapping.Finally,parameter optimization of multiple machine learning algorithms was made with F1 value as selection criterion to select the algorithm with the best classification effect as classification model.Four machine learning algorithms,including KNN,SVM,decision tree and random forest,were adopted to analyze OpenIDEO data,among which the random forest algorithm generated the maximum F1 value(0.919 09)through parameter optimization.For data validation,such algorithm could also produce good classification effects.The adoption of machine learning method is highly feasible and effective for creative identification in open innovation community.It can greatly reduce communitys input in creative screening,improve innovation efficiency and optimize community ecology.KEY WORDS:open innovation;innovation community;creative identification;machine learning 第 44 卷 第 8 期 薛水晶,等:基于机器学习的开放创新社区创意识别方法研究 73 在互联网发达的知识经济时代,“引入外部创新能力,充分利用外部及互联网用户资源进行创新”的开放式创新(Open Innovation)模式1,不断融合新的技术与的形式,逐渐成为企业创新的主导模式。目前,国内外众多知名企业基于互联网平台构建开放创新社区,聚集广泛的群体智能资源,通过“用户评论”“设计大赛”等形式聚集信息、知识,并通过各种激励方式推动用户创新2。开放创新社区中有价值的用户创意能被企业识别、采纳,甚至转换为成功的商业产品,能有效降低企业的研发成本,增强企业的创新能力。因此,如何从大量用户创意中高效准确地识别出潜在的、有价值的创意,是企业提高开放创新绩效的关键。受用户创新角色的随机性与不确定性、用户创新行为的复杂性与动态性、用户创意产出内容的丰富性与多样性等的影响,大多数开放创新社区中的用户创意识别与价值评估存在耗时长、效率低、无明确评估审核标准等3问题。为解决这一问题,本文基于用户特征、用户参与度和创意内容特征,构建创意识别指标体系,探究基于机器学习的用户创意识别方法,为企业发掘开放创新社区中潜在的有价值、高质量的创意提供借鉴。1 开放创新社区创意识别与评估相关研究 开放创新社区中的群智创意识别与评估是企业解决技术难题、寻找优秀创意、发掘商业机会的关键步骤。基于开放创新社区的设计活动往往会收集到大量的、质量参差不齐的用户创意,为精准识别符合企业创新需求、契合市场发展的有价值的创意方案,开放创新社区在用户创意识别方面需要建立系统性、合理性的评估指标与审核机制。目前,为有效识别、评估开放创新社区的用户创意,大多数学者研究开放创新社区创意采纳的影响因素。王楠等3基于详尽可能性模型,考虑用户社区地位、用户贡献行为、社区认可度和创意内容质量,构建了用户创新社区四维度创意采纳模型,分析了各维度中不同因素对创意采纳的影响作用;刘晴晴4从信息源可信度理论和信息论证质量的视角,基于开放创新社区 Salesforce Success Community 的用户及创意数据,研究创意评论数、创意评论内容、创意内容长度、创意表达方式等对创意采纳的影响;Hossain 等5通过分析戴尔 Idea Storm 平台的公开数据,研究创意发布时间、创意投票、评论内容、想法总数等属性对创意采纳的影响,发现提交的想法总数、创意评论、创意收到的投票数与创意实现显著正相关,有价值创意的方案可能会藏在创意评论中;Li 等6构建了用户创意被采纳、实施的影响因素模型,并得出各因素对用户创意实施的影响程度。也有一些学者研究用户创意的价值及其影响因素,如王楠等7基于创新重组理论,运用多群组结构方程模型与同感评估技术,以小米、华为、苹果员工及小米 MIUI 社区用户、华为社区、苹果社区用户数据为例,研究分析内、外部领先用户创意价值的差异;郭伟等8基于需求满足理论,以 LocalMotors 平台创新活动为例,研究了用户反馈的数量、质量和情感对用户个体创新贡献的影响,得出了各因素对创新贡献的影响方向与影响程度,对用户创新价值具有指导作用。现有研究较少关注如何提高创意方案识别与评估的效率,尚未深入研究如何从大规模创意设计方案中挖掘出有潜在价值创意的方法。2 开放创新社区创意识别与评估模型 2.1 创意识别与评估模型构建 开放式创新的本质是获取与整合企业内、外部知识以提高创新绩效9,群智创意识别与评估实质上是对创意知识的识别与评估。从组织知识创新的角度来分析,创新参与用户是知识创新的主体,用户创新行为反映了知识交互、转移、吸收、整合与创新的过程,知识创新的结果以创意内容体现出来,故认为创新参与用户、用户创新参与行为及知识创新产出内容是影响创意质量和价值的关键因素。由此,基于现有的文献研究基础,综合考虑创意产出的过程与影响创意质量及价值的关键因素,建立了一个包括用户特征、用户过程参与度和创意内容特征三个维度的创意识别与评估模型,见图 1。2.2 评价指标及解析 根据以上模型,构建了开放创新社区创意设计方案的评价指标体系,详细的指标及解析如下。2.2.1 用户特征指标 2.2.1.1 用户等级、特征标签与用户评分 用户标签是对用户信息和特征的抽象概况,大多数开放创新社区会综合考虑社区用户的知识能力、行为习惯、社交情况等,结合用户参与创新活动的历史行为数据,包括提交创意数量、获奖创意数量、评论数量等,从多个维度对用户的各种能力与行为进行综合评估,为用户划分等级,并标记特征标签,甚至对用户综合能力进行评分。用户等级、特征标签与用户评分可以反映用户创新能力,创新能力突出的用户能更快地识别创新需求,更有效地提出有价值的创意10,且创意被采纳的机会更大。因此,用户等级、特征标签与用户评分等在一定程度上可以反映创意的潜在价值以及被采纳的可能性。2.2.1.2 用户提交创意数量 Hossain 等5在研究中发现,用户提交的创意越多,其创意被采纳的可能性就越大;张静等11在研究中发现,用户在创新社区中发布的创意数量越多,社区中设计知识认知扩散的广度越大,可以促进社区用 74 包 装 工 程 2023 年 4 月 图 1 开放创新社区创意识别与评估模型 Fig.1 Creative identification and evaluation model of open innovation community 户快速形成设计认知,进一步提高用户的创新质量。此外,用户在开放创新社区中通过提交创意分享知识,为社区成员间的知识交流提供了情境空间,有利于用户间的知识交互,可以促进社区用户间的非正式学习,帮助用户形成多元化知识体系12,进而提高用户的创新能力。因此,用户提交创意数量可以反映用户创新活跃度与创新状态,间接影响用户创意产出的质量与价值。2.2.1.3 团队规模 开放创新社区基于互联网的建立,在线用户遵循一定的群体结构和运行机制,自愿贡献体现个体智能的可衡量产出物,并通过群智协同产出高质量的知识成果或产品13。故开放创新社区的创新过程,既包含体现个体智慧的创新认知、推理与决策行为,又包含体现创新团队的群智协同与知识交互行为14。陈文春等15对创新团队的异质性进行研究,指出知识异