温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
人工
干预
CJFD
检索
结果
影响
李芳
中国科技信息 2023 年第 3 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Feb.2023-16-专利分析随着专利审查智能检索系统的上线和使用,其语义检索的功能相较于传统 S 系统检索为审查员的检索与浏览提供了较大的便利,下面通过实际案例简单介绍一下使用智能检索系统人工干预对 CJFD 数据库语义检索结果的影响。语义检索及其人工干预方式简介语义检索的人工干预方式包括调整语义基准、调整语义分词、布尔检索+语义排序。调整语义基准:当语义基准为案件号时,以分类号模型和分词模型进行筛选,其信息表达最为全面,语义分词表达效果较好。当语义基准为文本时,其不经过分类号模型的筛选,与案件号的语义基准相比,其可以对特定信息进行精准表达。调整语义分词:语义分词是基于分词模型从语义基准中自动提取的词,其权重是基于该分词在整个文本中出现的频率等因素确定,无论语义基准是案件号还是文本,其对于智能检索的影响最终都是体现在提取的语义分词以及该语义分词的权重上,因此,调整语义分词和权重对于智能检索结果影响很大。分词及其权重调整的方式包括:删除分词(错误分词和噪行业曲线可替代度影响力行业关联度李芳,国家知识产权局专利局专利审查协作广东中心,专利审查员,助理研究员,主要从事发明专利审查工作。人工干预对 CJFD 库检索结果影响李 芳声词)、新增分词(涉及关键信息的分词)、调整分词权重(涉及关键信息的分词权重调高,其他分词权重调低),但是语义分词调整是一把双刃剑,调整结果可控性较低,调整时需谨慎。布尔检索+语义排序:布尔检索输入可控制,输出结果可预期,依赖审查经验,检索结果经过语义排序又能够充分利用语义排序功能,能够快速、高效的获得对比文件,比较推荐该语义检索方式。人工干预对 CJFD数据库语义检索结果分析(一)案件号纯语义检索智能检索系统的最大亮点在于其语义检索功能,因此,优先推荐尝试案件号纯语义检索,部分案件仅通过纯语义检索即可获得对比文件。案例 1:一种砂纸板岩隧道施工方法。审查员在专利库没有检索到对比文件,然后转到非专利数据库进行检索,在智能检索系统选择 CJFD 数据库,直接使用案件号纯语义检索,排序第 1 位即获得对比文件 1(“砂质板岩隧道光面爆破控制施工技术研究”,张洪江等,山西建筑,第 44 卷第 3 期,2018 年 1 月)。案例2:一种降低装定诸元需求的卫星制导弹药制导方法。根据审查经验导弹制导方法多在非专利文献库,审查员通过在专利库初步检索未获得对比文件,然后在智能检索系统选择 CJFD 数据库,直接使用案件号纯语义检索,排序第1 位即获得可以单独评述权利要求 1 的对比文件 1(“基于空中发射点的在线诸元计算方法研究”,鲜勇等,飞行力学,第 25 卷第 4 期,2007 年 12 月)。案例 1 和案例 2 均是使用案件号直接纯语义检索,在结果的第 1 篇即获得对比文件,极大地提高了非专利文献检索的效率,使用 CJFD 数据库检索非专利文献时,推荐首先尝试使用案件号纯语义检索。(二)调整语义基准对语义检索结果的影响在 CJFD 数据库以文本为语义基准语义检索相对于案件号纯语义检索,检索结果并不理想,在非专利库优先推荐使用案件号作为语义排序基准。案例 3:模拟射击训练科目创建方法、装置和系统。在专利库未获得对比文件的情况下,在智能检索系统选择 CJFD 数据库,以权利要求全文为语义排序基准进行语义检索,检索结果如图 1 所示,对比文件 1 排在第 60 位。审查员后来尝试直接使用案件号纯语义检索,排序第 4-17-CHINA SCIENCE AND TECHNOLOGY INFORMATION Feb.2023中国科技信息 2023 年第 3 期专利分析位即获得对比文件 1(“军事训练多媒体仿真系统研究”,余军涛等,系统工程与电子技术,第 24 卷第 4 期,2002年4月),检索结果如图2所示,使用案件号纯语义检索结果优于使用文本纯语义检索结果。案例 4:一种导弹发射前冲后坐测试系统及方法。审查员在获得对比文件 1 的情况下,针对某从属权利要求,采用描述该从属权利要求的文本作为语义排序基准在 CJFD 数据库进行检索,排序结果第 1 位获得日期不可用的文献(“一种简易肩扛导弹发射冲击力测试系统”,姚翔等,指挥控制与仿真,2020 年 10 月,第 42 卷第 5 期),通过该文献的参考文献获得对比文件2(“架座武器后坐力测试技术研究”,姚养无,测试技术学报,2010 年,第 24 卷第 2 期),而推送的前 400篇并未发现对比文件 2。后来尝试直接采用案件号作为语义排序基准,检索结果如下图所示,结果排序第 1 位获得日期不可用文献(“一种简易肩扛导弹发射冲击力测试系统”,姚翔等,指挥控制与仿真,2020 年 10 月,第 42 卷第 5 期),第 2 位即获得对比文件 2(“架座武器后坐力测试技术研究”,姚养无,测试技术学报,2010 年,第 24 卷第2 期)。针对从属权利要求的检索,按照常理以描述该从属权利要求的文本为语义基准进行针对性的检索,理应更有可能获得对比文件 2,但是在400 篇结果中并未获得对比文件 2,而采用案件号纯语义检索时却获得了对比文件 2 且排位相对靠前,如图 3所示。可以看出以文本为语义排序基准语义检索相对于案件号纯语义检索,检索结果并不理想。通过案例 3 和 4 可以看出,以文本为语义排序基准语义检索相对于案件号纯语义检索,检索结果并不理想,原因在于在非专利数据库使用案件号作为语义排序基准,由于非专利文献没有分类号信息,不受分类号分词模型的影响,仅是以文本分词模型进行筛选,其文本的信息表达包括(摘要分词、权利要求分词、说明书分词),分词表达比较全面,且相比于以文本为语义基准,语义分词表达效果较好,图 1图 2图 3图 4中国科技信息 2023 年第 3 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Feb.2023-18-专利分析因此在非专利库优先推荐使用案件号作为语义排序基准,除非需要检索某个细节,可以尝试表达该细节的文本作为语义基准进行更加针对性的检索。(三)布尔检索+语义排序对语义检索结果的影响布尔检索+语义排序的人工干预方式相对于调整语义分词及其权重的人工干预方式更可控、更高效,通过案件号纯语义检索结果不佳时,推荐使用布尔检索+语义排序的人工干预方式。案例 5:一种水下爆源冲击波载荷模拟试验系统和方法。考虑到申请人为高校,首先选择CJFD 数据库,审查员选择布尔+语义排序的方式进行检索,构建布尔检索式“水下 and(or 爆炸,爆破)and(or 爆轰波,冲击波,应力波)and 叠加”,结果数 973 篇,语义排序之后,在结果的第 20 位获得对比文件 1(“水下多点爆炸冲击波叠加效应研究”,林尚剑等,兵工学报,第41卷增刊1),检索结果如图4所示:后来审查员尝试采用案件号纯语义检索,发现对比文件 1 排在第 136位,检索结果如图 5 所示:在纯语义检索基础上,审查员尝试更改语义分词权重,将语义分词“水下”“爆炸”和“冲击波”的权重调整为 5,对比文件 1 的排位调整到了第 48 位,检索结果如图 6 所示:审查员尝试增加语义分词“叠加”,权重设为 5,对比文件 1 的排位调整到了第 45 位,检索结果如图 7 所示:通过案例 5 可以看出,通过纯语义检索在前 100 篇未获得对比文件 1时,通过布尔检索+语义排序的方式获得对比文件更高效,虽然也可以采取人工调整语义分词的方式,但不管是调整语义分词权重还是增添语义分词其结果不可控,不如直接采用布尔检索+语义排序的方式,根据审查经验,当针对发明点能够准确全面的构造布尔检索式时,推荐优先使用布尔检索+语义排序的人工干预方式。结语上述 CJFD 数据库案例的检索情况对比如表 1 所示。通过上述 5 个案例分析可知,智能检索系统 CJFD 数据库的推出很大程度上提高了非专利文献检索的效率,推荐优先尝试使用案件号纯语义检索,当案件号纯语义检索结果不佳时,推荐使用布尔检索+语义排序的人工干预方式,最后可以尝试使用调整语义基准、语义分词及其权重。图 5图 6图 7表 1