基于
科技
差距
评估
GTM
专利
地图
识别
技术
机会
李子
收稿日期:2022-08-30 修回日期:2022-10-28基金项目:河北省自然科学基金项目“制造业创新链断链风险管理及科技金融修复机制研究”(编号:G2021202001);河北省教育厅人文社会科学研究重大课题攻关项目“创新生态系统发展理念引领的河北省高质量发展机制研究”(编号:ZD202004);河北省社会科学基金重大项目“新时代河北省区域创新驱动发展机制建设研究”(编号:HB19ZD03);河北省创新能力提升计划项目软科学研究专项“河北省钢铁产业碳中和技术创新路径研究”(编号:225576190D)。作者简介:李子彪,男,1979 年生,博士,教授,博士生导师,研究方向:技术创新管理;孙可远,男,1993 年生,博士研究生,研究方向:技术创新管理;陈 迪,女,1997 年生,博士研究生,研究方向:技术创新管理;聂 进,男,1984 年生,博士研究生,研究方向:技术创新管理;鲁 雪,女,1993 年生,博士研究生,研究方向:技术创新管理。通信作者:孙可远基于科技差距评估 GTM 专利地图识别的技术机会*李子彪1 孙可远1,2 陈 迪1 聂 进1 鲁 雪1(1.河北工业大学经济与管理学院 天津 300401;2.天津商业大学管理学院 天津 300133)摘 要:研究目的识别具有科学可行性的技术创新机会,对企业降低研发失败风险和制定创新战略具有重要价值。研究方法该文提出一种融合式的识别科学可行的技术创新机会的方法。首先,选取 GTM 专利地图对专利数据进行文本挖掘可视化表达,识别技术空白并逆向解读;然后,对科学文献进行文本挖掘和 ORCLUS 聚类,获取科学知识主题;最后,通过 TF-IDF 向量的余弦相似值评估潜在技术机会与科学主题的相似性,筛选出科学可行的技术创新机会。研究结论对质子交换膜燃料电池进行了实证研究,识别出 8 项科学可行的技术创新机会,证明了该模型的有效性,可以为企业制定研发战略提供决策支持。关键词:GTM 专利地图;科技差距;机会识别;技术创新机会;质子交换膜燃料电池中图分类号:F273.1;G306 文献标识码:A 文章编号:1002-1965(2023)07-0147-07引用格式:李子彪,孙可远,陈 迪,等.基于科技差距评估 GTM 专利地图识别的技术机会J.情报杂志,2023,42(7):147-153,44.DOI:10.3969/j.issn.1002-1965.2023.07.021Evaluating the Technology Opportunities of GTM Patent Map RecognitionBased on Science and Technology GapLi Zibiao1 Sun Keyuan1,2 Chen Di1 Nie Jin1 Lu Xue1(1.School of Economics and Management,Hebei University of Technology,Tianjin 300401;2.School of Management,Tianjin University of Commerce,Tianjin 300133)Abstract:Research purpose Identifying technological innovation opportunities with scientific feasibility is of great value for enterprisesto reduce the risk of R&D failure and formulate innovation strategies.Research method This paper proposes a fusion method to identifyscientifically feasible technological innovation opportunities.Firstly,GTM patent map is selected to conduct text mining visual expressionof patent data,identify technical gaps and reverse interpretation.Then,the scientific literature is mined by text mining and ORCLUS clus-tering to obtain scientific knowledge topics.Finally,the cosine similarity value of TF-IDF vector is used to evaluate the similarity betweenpotential technological opportunities and scientific themes nd scientific and feasible technological innovation opportunities are screened out.Research conclusionThe empirical study on proton exchange membrane fuel cell has identified 8 scientific and feasible technological in-novation opportunities,which proves the effectiveness of th model and can provide decision-making support for enterprises to formulateR&D strategies.第 42 卷 第 7 期2023 年 7 月 情 报 杂 志JOURNAL OF INTELLIGENCE Vol.42 No.7July 2023Key words:GTM patent map;technology gap;opportunity identification;technological innovation opportunities;proton exchange mem-brane fuel cell0 引 言技术机会是技术进步以增强产品功能或产品生产的一系列可能性,探索和评估技术发展的风险和机会的技术机会分析是一种技术预测,因为它旨在预测技术发展的未来情景1。技术机会分析衍生的新技术思想将极大地促进企业创新的增长和成功2,越来越多的技术开发人员和学者投入到技术机会分析的研究中3-5。但是目前在技术机会识别的方法上仍有待引进新兴的计算机技术以提高识别结果的客观性、精确性和可行性。在定性识别技术机会方面,德尔菲法、专家经验、问卷调查和 TRIZ 具有易于验证的优点,但是操作成本高、耗时长6。在量化识别方面,基于文献计量、文本挖掘和社会网络等方法已经发展成为了较为丰富和完善的体系,但是在识别结果的精确性、客观性及可行性等方面,仍有待进一步优化。尤其是随着大数据时代的到来和机器学习技术的蓬勃发展,技术机会识别可以引入更智能的方法,例如利用文本挖掘、数据挖掘和机器学习等方法定量地、客观地对技术机会进行识别和评估,以逐步摆脱对专家知识的依赖7。因此,有必要丰富和拓展现有技术机会识别、评估与筛选的智能分析方法。围绕以往技术机会识别存在的结果呈现不够直观、解读不够客观及未对研发的难易性进行评估等不足,本文基于技术机会识别与可行性评估双重视角,提出了一套融合文本挖掘、专利地图、主题聚类、语义相似度技术的组合式分析方法,以期识别出具备科学可行性的技术创新机会。1 理论基础 1.1 基于专利地图的技术机会识别随着技术竞争的日趋激烈,专利地图已经成为技术挖掘的有效工具。技术地图是由技术数据信息构成,通过算法将原始数据从高维数据空间映射到低维正则网格上,地图中空白点表示该点并没有与之对应的技术组合,即为技术空白点,通过对技术空白点的分析可以更为有效地识别新兴的技术创新机会的8。以往研究基于专利地图以识别技术机会的方法大致可分为三类:a.自组织映射网络(SOM)的专利地图将专利之间的复杂关系和专利的动态模式可视化。这种方法基于无监督学习神经网络形成目标网络节点,但对技术要求较高,不能反向解释地图6。b.主成分分析(PCA),它可以用更少的变量解释更多的原始变量,但可视化程度较低,无法向后解释地图9。c.生成式拓扑映射(GTM)是一种通过贝叶斯理论将多维数据空间映射到低维潜在空间的概率方法10,可视化效果优且可逆向解释技术空白。基于专利地图的新兴技术机会挖掘的关键在于绘制科学的专利地图和技术空白的客观解释。虽然以上3 种方法都能够客观科学地展现专利数据,而在技术空白的解释方面,PCA 和 SOM 识别出的专利地图都需要依靠科研人员主观地进行解释11,GTM 却能够自动识别地图中的空白区域且还可以通过逆映射自动客观地提取原始主题词矩阵来解释技术空白12。正是由于 GTM 在识别空白技术的同时还可以客观地解读技术空白,故本文选取 GTM 专利地图法来识别质子交换膜燃料电池潜在的技术创新机会。1.2 基于科技差距筛选技术机会虽然专利分析是技术机会识别的代表性方法,但科学与技术知识的结合滋养了探索新技术机会的过程13,科学知识为技术创新提供了基础。科学研究的主要目标是探索未知领域并为公众创造知识,而不是为私营企业创造新技术和新产品,但是基础研究的成果则往往为工业界带来了技术创新的种子14。由于科学发现可能具有科学家不熟悉的工业应用,而企业管理人员往往没有意识到哪些科学发现可以促进他们的技术创新15,因此,识别那些还未被工业界重视的基础研究一直以来都是研发人员关注的焦点。图 1 基于科技差距对技术空白机会的识别筛选科学与技术之间的差距则意味着技术创新的潜力,有助于探索新的技术机会16。Meijia C 和 Shen 等人15-16正是基于此,通过将专利文本的聚类结果与科学文献的聚类结果进行比较分析,确定了科学与技术之间的差距,并将对比结果分为四个不同的类别15,如图 1 所示。C 区间由学术界的基础研究组成,但还没有被商业化,没有被企业视为专利进行开发活动,这可能意味着该区域存在着潜在的技术创新机会。本文正是结合科学界和工业界的研究差距,以这四种关系为基础,通过科学知识主题聚类对技术空白机会进行841 情 报 杂 志 第 42 卷评估和筛选,以获得 C 区间的技术创新机会,即具有科学支撑的科学可行的技术创新机会。1.3 文献评述与主要研究内容现有关于技术机会的研究在分析方法、性能和规范方面存在一些局限。第一,大多数现有方法都基于定性分析,对专家意见依赖过重;第二,虽然已有研究人员采用可视化的方法来将未开发的技术空白作为技术机会,但对其的解读依赖于专家知识、不够客观,未能深入解读技术空白的真正含义;第三,即使在定量方法中,对技术机会的识别也并不系统与完善,较少对识别结果的研发突破难易程度进行评估,继而筛选出具有科学可行的技术创新机会;第四,以往研究大多是对专利或论文单一维度数据源进行技术机会分析,缺乏对多源文献的综合运用。为了弥合这些研究不足,本研究拟对以往识别方法进行融合优化,以发现技术创新的可行性机会。本文从技术机会识别与评估的双重视角出发,构建了一种融合 GTM 专利地图和 ORCLUS 和 TF-IDF 向量的余弦相似度方法的优势的技术机会识别框架,以帮助获得科学可行的技术创新机会。首先,选取 GTM 专利地图方法对专利数据进行文本挖掘,可视化表达技术领域的专利布局,识别出现存的专利空白,并逆向解读出潜在的技术创新机会;其次,对科学文献数据进行文本挖掘,然后采用 ORCLUS 主题聚类,获得目标领域的科学知识主题;然后,通过 TF-IDF 向量的余弦值来测量潜在技术创新机会和科学知识主题的语义相似性,以评估和筛选出具