2023.4电脑编程技巧与维护1概述平台前端使用Vue、Bootstrap、Quasar,后端使用NestJS框架搭配MongoDB数据库,结合Python的爬虫技术实现了对高考大数据的实时爬取、数据逻辑处理及数据的可视化展示,从而实现了新高考政策形势下志愿填报的辅助决策。利用Python语言,结合分布式爬虫框架Scrapy,对各大高考数据网站进行源码分析,从而实现对高考大数据进行分布式爬取。利用Python大数据处理技术——Numpy对获取的数据进行去杂、优化,并将其转换为MondoDB数据库所支持的数据格式。最后利用Pymongo技术将数据存入非关系型数据库MongoDB,以备后续使用。NestJS框架是一款高效可伸缩的开源服务端框架,其核心思想是建立一个层与层直接耦合度小、抽象化高的架构体系,其灵感多来自Angular,与JavaSpring框架有着异曲同工之妙。其向人们展示了完整且结构良好的文档,允许开发人员以特定方式使用通用工具和代码来消除显式配置的需要。在兴趣测评模块中,通过用户填写设置的调查问卷,系统自动生成适合的专业。在这一部分的匹配算法模型中,研究基于深度学习的文本匹配算法,基于残差增强模块和简单注意力机制的文本匹配框架,保留文本的低层传播特征,增强网络对于文本特征信息的抽取。针对文本编码后的特征,采用简单注意力机制实现文本之间的特征对齐。利用文本相似度匹配算法,设计一个偏好权重因子a,通过该偏好权重因子解决由偏好因素引发的相似度计算偏差问题。在非结构化文本的匹配计算中,先采用Word2vec进行词向量的训练,然后通过双向循环门单元再次训练词向量语义信息,解决Word2vec对于词语顺序不敏感且无法利用词性关联信息等问题。通过加入Attention机制,提高关键词的权重。通过BERT预训练模型建模答案选择任务,并采用基于特征和基于微调这两种策略实现。在基于特征的方法中利用预训练BERT模型获取上下文词向量,提出将自注意力加权向量与双向注意力加权向量进行比较聚合,得到问答对的匹配分值。在基于微调的方法中通过多视图长短期记忆(MVLSTM)扩展BERT模型,使问答对之间能够直接交互,充分获取与句子匹配的语义信息。2系统功能分析与设计2.1开发语句及工具平台使用超文本标记语言(HTML)、层叠样式表(CSS)、JavaScript、Python和NestJS,其前端主要采用Vue、Bootstrap框架搭建,结合Echarts技术实现数据可视化等;其后端使用NestJS框架搭建,负责进行数据处理与数据分析;对高考数据采用基于Bson存储的MongoDB数据库进行存储,显...