电子技术第52卷第2期(总第555期)2023年2月67ComputerEngineering计算机工程摘要:阐述深度文本匹配的技术原理,基于该模型在案例搜索场景中的应用实践,针对实验结果中的正态分布阈值导致流量规模与效果的不确定性,提出改进方案。关键词:自然语言处理,NLP,文本匹配,深度学习。中图分类号:TP18,TP311.13文章编号:1000-0755(2023)02-0067-03文献引用格式:赵小娟.深度文本匹配代表模型DSSM在搜索算法中的应用[J].电子技术,2023,52(02):67-69.料库中的词语映射到多维的向量空间中,更好地解决了词语匹配的同义性问题[1]。DSSM全称是DeepStructuredSemanticModels,即基于深度网络的语义模型,是2013年由微软研究院提出的,是目前深度学习领域中主流的文本匹配模型[2]。本文将重点研究DSSM模型,并在案例阿里妈妈品牌广告搜索场景中进行应用实践,针对实验结果中正态分布阈值导致流量规模与广告效果的不确定性,提出了改进方案,进一步优化广告搜索效果。2DSSM技术原理DSSM是一种利用深度神经网络将文本表示为低维度的向量,应用于文本相似度匹配场景下的算法。DSSM模型使用深度神经网络(DeepNeuralNetworks,DNN)将高维稀疏文本特征向量映射到语义空间中的低维密集特征。匹配过程如下:首先基于词袋模型(Bag-of-words,BOW)得到文本的向量表征,再基于词散列(WordHashing)方法进行降维操作,并通过多层感知器模型,得到最终128维的语义表征,最后对两个文本语义向量计算余弦相似度得到相似度分数。DSS模型解决潜在语义分析(LatentSemanticAnalysis,LSA)、潜在狄利克雷分配LDA(LatentDirichletAllocation,LDA)、自动编码器(Autoencoder,0引言文本匹配是自然语言理解中的一个重要的基础问题。在自然语言处理任务中,文本匹配可应用于信息检索、问答系统、文本聚类等应用场景。其中,信息检索可抽象为检索词和文档资源的匹配,问答系统可抽象为问题和候选答案的匹配,文本聚类可抽象为各文本间的匹配问题。在信息检索方面,最常见的一个业务场景便是电商搜索。电商搜索的目的在于如何从海量的商品当中找到用户需要的商品。目前,绝大多数的商品召回和排序都是基于嵌入(Embedding)技术,如何构建商品向量、如何解决搜索词与商品名称之间的语义鸿沟问题、如何解决店铺特征稀疏等问题以及如何给用户推荐合适的商品成为商品召回和排序中的主要问题。1研究背景传统的文本匹配技术主要基于统计学方法,通过词汇重合度来计算两段文本的字...