基于
改进
神经网络
韩语
机器翻译
系统
设计
袁敏
收稿日期:2022-05-12基金项目:省教育厅项目西安旅游资源的韩译现状及对策研究以大雁塔大唐芙蓉园景区为例(18JK0995)作者简介:袁敏(1984-),女,陕西西安人,博士研究生,讲师。基于改进神经网络的韩语机器翻译系统设计袁 敏(西安翻译学院,西安 710105)摘 要:韩语机器翻译受到韵律格式影响,导致翻译的可靠性不好,提出基于改进神经网络的韩语机器翻译系统设计方法。采用语料库模型建立韩语机器翻译系统的双语平行语料库,建立以深度学习为基础的神经网络翻译语义控制模型,采用规则和模板的匹配方法,采用统计机器翻译的方法,构建以语义综合评估为翻译结构参数模型的韩语机器翻译自然语言处理模型,采用无监督的神经网络学习方法,建立韩语机器翻译的语义对照模型,实现迭代反向翻译和回译。系统构建中,设计了数据库模块、语义推荐模块、数据访问层模块和翻译生成模块,在改进神经网络模型下实现机器翻译系统设计。测试结果表明,该方法进行韩语机器翻译的可靠性较好,具有很好的语义连贯性、翻译一致性和翻译流利性,翻译输出的准确度较高。关键词:改进神经网络;韩语;机器翻译;语料库 中图分类号:TP391 文献标识码:A DOI 编码:10.14016/ki.1001-9227.2023.01.212Design of Korean Machine Translation System Based on Improved Neural NetworkYUAN Min(XIAN FANYI University,Xian 710105,China)Abstract:Korean machine translation is influenced by prosodic format,which leads to poor reliability of translation.This paper puts forward a design method of Korean machine translation system based on improved neural network.The bilingual parallel corpus of Korean machine translation system is established by corpus model,and the semantic control model of neural network translation based on deep learning is established.The natural language processing model of Korean machine transla-tion with semantic comprehensive evaluation as the translation structure parameter model is constructed by the matching meth-od of rules and templates and statistical machine translation method.The semantic comparison model of Korean machine trans-lation is established by unsupervised neural network learning method,and iterative reverse translation and back translation are realized.In the system construction,the database module,semantic recommendation module,data access layer module and translation generation module are designed,and the machine translation system is designed under the improved neural network model.The test results show that this method is reliable in Korean machine translation,with good semantic coherence,trans-lation consistency and translation fluency,and the accuracy of translation output is high.Key words:improving neural network;Korean;Machine translation;corpus0 引言随着机器学习和自然语言处理技术的发展,采用智能机器学习方法进行韩语机器翻译研究受到人们的重视,韩语的格律差异度较大,在翻译过程中容易受到韵律输出不稳定性的影响,导致韩语机器翻译的输出稳定性和可靠性不好,需要结合语义学习和机器学习方法,建立数据筛选模式下的语义参数解析模型,通过数据筛选和深度学习方法,实现韩语机器翻译设计,设计基于机器学习的韩语机器翻译系统,通过机器人技术、自然语言处理技术和生物信息处理技术,结合语音识别的方法,进行韩语机器翻译系统设计。研究韩语机器翻译系统的优化设计方法,在机器翻译研究领域中成为热点1。当前,对韩语机器翻译方法主要有基于模糊信息聚类的韩语机器翻译方法、基于统计模型的机器翻译方法以及基于深度学习模型的机器翻译方法等,结合语料分析模型,通过智能机器学习技术,实现韩语机器翻译2,文献3中提出基于 Spark 的大规模机器翻译系统设计方法,利用单机多线程工具 MGIZA+构建完整的词对齐训练方法对短语翻译模型进行训练,结合模型化参数识别,实现机器翻译,但该方法进行短语翻译的准确性不高。文献4中提出基于 B/S 框架的交互式英汉机器翻译系统设计方法,以 B/S 三层架构为基础设计系统框架,在系统设计部分实现对主英汉翻译硬件构造设计,但该方法进行英语翻译中存在用词不准确、语法错误、系统发音不清楚等问题5。针对上述问题,提出基于改进神经网络的韩语机器翻译系统设计方法,首先构建语料库,然后采用无监督的神经网络学习方法,建立韩语机器翻译的语义对照模型,实现迭代反向翻译和回译,212基于改进神经网络的韩语机器翻译系统设计 袁 敏最后进行实验测试分析,展示了本方法在提高韩语机器翻译准确性和稳定性方面的优越性能。1韩语机器翻译系统总体结构和语料库构造1.1 韩语机器翻译系统总体结构采用语料库模型建立韩语机器翻译系统的双语平行语料库,建立以深度学习为基础的神经网络翻译语义控制模型,采用规则和模板的匹配方法,分析韩语机器翻译系统的总体结构模型,结合场景数据融合方法,采用可视化的程序嵌入式调度,进行韩语机器翻译系统可视化集成智能控制,结合总线传输控制技术,建立韩语机器翻译系统的上位机转换控制的方法6,结合动态链接库特征分布式重构的分析,设计的韩语机器翻译系统分为三层体系结构,分别数据层、接口层和应用层7,韩语机器翻译系统的三层体系结构如图 1 所示。图 1 韩语机器翻译系统的三层体系结构根据图 1 所示的韩语机器翻译系统的三层体系结构特征分析,采用 VIX 总线控制技术实现韩语机器翻译系统的总线集成控制和信息调度,构建韩语机器翻译系统的集成信息处理模块,采用语料库模型建立韩语机器翻译系统的双语平行语料库,建立以深度学习为基础的神经网络翻译语义控制模型,采用区块融合方法,进行韩语机器翻译系统控制过程中的指令交互,通过 AD 转换,可以获得韩语机器翻译系统的语义参数信息8,构建底层数据库,实现对韩语机器翻译系统的语义特征融合,系统的总体结构如图 2 所示。图 2 韩语机器翻译系统的总体结构1.2 系统功能模块及语料库构造采用 API 接口设计方法,实现对韩语机器翻译的自动化控制,在专用短程通信(Dedicated Short Range Com-munication,DSRC)标准体系结构下,建立韩语机器翻译系统的 IETF 的 SIP(Session Initiation protocol)会话协议,构建韩语机器翻译系统的业务功能模块、数据管理模块,基于 TinyOS 实现韩语机器翻译系统的信息管理控制,在网络组件接口设计中,采用 MISC_DYNAMIC 总线控制方法,进行韩语机器翻译系统的总线传输控制9,系统的软件实现流程如图 3 所示。图 3 系统的软件实现流程根据图 3 给出的基于 B/S 构架的韩语机器翻译系统的总体设计构架,在 Hadoop、MongoDB、Storm 三种开源的底层计算框架下进行韩语机器翻译系统的服务系统的功能模块设计,结合过程管理和无线通信网络构架,在嵌入式控制协议模型中,建立韩语机器翻译系统的执行元件组合模块10,根据上述分析,得到系统的功能结构模块如图 4 所示。图 4 翻译系统的功能结构模块2 韩语机器翻译系统算法设计与实现2.1 基于改进神经网络的机器翻译算法采用统计机器翻译的方法,构建以语义综合评估为312自动化与仪器仪表2023 年第 1 期(总第 279 期)翻译结构参数模型的韩语机器翻译自然语言处理模型。拟采用 RBF 神经网络实现机器翻译算法,该神经网络包含输入层、隐含层和输出层,输入 m 维向量 X,隐层大小为 n,其中 nm。但在传统的 RBF 神经网络中,当神经元的输出接近 1 时,其激活函数 Sigmoid 函数曲线相当平缓,导致其导数就很小,说明神经网络学习较为缓慢。为了解决这一问题,采用交叉熵代价函数对神经网络进行改进,神经元的交叉熵代价函数定义如下C=-1nxylna+1-y()ln 1-a()(1)此处采用交叉熵代价函数的原因为,该函数为非负函数,且对于所有的训练输入 x 而言,神经元的实际输出值更接近目标值,争取率较高,此时的交叉熵将接近0。计算关于权重和偏置的偏导数如下Cb=1nx z()-y()Cwj=1nxxj z()-y()(2)采用以上改进神经网络进行翻译过程中的学习训练11,改进神经网络拓扑结构如图 5 所示。图 5 改进神经网络拓扑结构在图 5 所示的神经网络模型中,输入端是保护和控制存储单元,采用无监督的神经网络学习方法,建立韩语机器翻译的语义对照模型12,步骤如下:1)给出输入节点,将韩语句子和白话文句子编码到编码特征空间,输入层有 N 及输入节点(即每个向量元素)的个数 k,以通用表示形式对语言进行编码,得到输出权重 i 将编码恢复为任何语言,令 x(t),t=0,1,n-1,为训练序列,置训练模型参数 t=0;2)对当前时刻的单词和上下文的向量进行自适应训练,得到训练向量模式 x(t)=(x0(t),x1(t),xk-1(t)T;3)根据白话文生成路线,得到 x(t)与全部输出节点的语料特征学习模型参数 j的距离dj=k-1i=0(xi(t)-ij(t)2,j=0,1,N-1(3)其中,j=(0j,1j,k-1,j)T;表示迭代反向翻译或回译的初始参数。4)求出从源语言到目标语言的单词向量映射 Nj,dj=min0jN-1dj;5)调整单词与其他语言的多种翻译相关参数,得到Nj所连接的权值,根据上下文预测特定词位 Nj,得到几何邻域 NEj(t)内节点所连接的权值ij(t+1)=ij(t)+(t)(xi(t)-ij(t)(4)其中,NjEj(t),0ik-10(t)1 上下文预测特定词位置周围的词,它和 NEj(t)一样随时间递减;6)获得相当准确的双语词典后,则 t=t+1,转到步骤(2)。根据上述算法设计,建立韩语机器翻译的语义对照模型,实现迭代反向翻译和回译,并用对抗性训练和其他方法来旋转一种语言的词嵌入结构13。2.2 韩语机器翻译语言建模初始化嵌入在一个共同的编码特征空间,得到的N