www.ChinaAET.comReviewandComment综述与评论计算机文本分析算法发展综述孙静含1,任静2(1.北京工业大学,北京100124;2.中国电子信息产业集团第六研究所,北京100083)摘要:计算机文本分析是自然语言处理领域的一个重要分支,是研究如何在文本数据中提取出给定语料的各类信息的计算机技术。目前,计算机文本分析已经进入了新的历史阶段,一方面关键词提取算法已经逐渐完备,另一方面随着BERT方法的出现,词向量计算问题也取得了极大的进步。但是,无论是关键词提取还是词向量计算都仍存在一些有待解决的问题。另外,现有的许多适合使用文本分析的研究仍在使用早期的文本分析方法。因此在未来,如何更好地降低模型尺寸以促进学科融合、提升文本分析的综合社会效益,成为文本分析算法发展的重要问题。关键词:文本分析;自然语言处理;算法中图分类号:TP181文献标志码:ADOI:10.16157/j.issn.0258-7998.223117中文引用格式:孙静含,任静.计算机文本分析算法发展综述[J].电子技术应用,2023,49(3):42-47.英文引用格式:SunJinghan,RenJing.Asurveyofthedevelopmentofcomputertextanalysisalgorithms[J].ApplicationofElec‐tronicTechnique,2023,49(3):42-47.AsurveyofthedevelopmentofcomputertextanalysisalgorithmsSunJinghan1,RenJing2(1.BeijingUniversityofTechnology,Beijing100124,China;2.TheSixthResearchInstituteofChinaElectronicsCorporation,Beijing100083,China)Abstract:Computertextanalysisisanimportantbranchinthefieldofnaturallanguageprocessing,anditisacomputertechnol‐ogythatstudieshowtoextractvarioustypesofinformationfromagivencorpusfromtextdata.Atpresent,computertextanaly‐sishasenteredanewhistoricalstage.Ontheonehand,thekeywordextractionalgorithmhasgraduallybeencompleted.Ontheotherhand,withtheemergenceoftheBERTmethod,thewordvectorcalculationproblemhasalsomadegreatprogress.However,therearestillsomeproblemstobesolvedinbothkeywordextractionandwordvectorcalculation.Inaddition,manyexistingstudiessuitableforusingtextanalysisstilluseancienttextanalysismethods.Therefore,inthefuture,howtobetterreducethemodelsizetopromotetheintegrationofdisciplinesandimprovethecomprehensivesocialbenefitsoftextanalysiswillbecomeanimportantissueinthedevelopmentof...