解放军外国语学院学报第46卷第1期·70·JournalofPLAUniversityofForeignLanguages2023年1月面向自动语音识别的阿拉伯语动词语音特点研究*潘基宏,黄娴,张克亮(信息工程大学洛阳校区,河南洛阳471003)摘要:阿拉伯语的自动语音识别是未来的发展趋势,从语言学的角度对阿拉伯语的语音特点进行规则描述,有助于提升自动语音识别的准确率。本文在借鉴传统标音法和三层分析法的基础上,对阿拉伯语的核心——动词的语音特点进行研究,提出以“时式、态、人称”三类语法范畴为目标,以“词根层、辅音层、CV音层、元音层”4个层次为路径,以“核心部分、词缀部分”两大模块为内容的分析方法,并以阿拉伯语三母动词的过去式为例进行分析,总结出“词根+CV模板+元音类型+词缀模板”的语音特点的形式化规则。关键词:自动语音识别;阿拉伯语;动词;语音特点;语法范畴中图分类号:H371文献标识码:A文章编号:1002-722X(2023)01-0070-080.引言阿拉伯语是22个阿拉伯国家的官方语言,随着“一带一路”倡议的推进,中国与阿拉伯国家之间的交往日益频繁,提升中国国内对阿拉伯语的翻译能力具有迫切的需求。在信息化时代,面对巨大的语言数据,翻译能力的建设不仅需要培养精通外语的翻译人才,更需要推动语言的智能化处理,而自动语音识别就是实现后者的关键技术之一。ASR旨在让机器听懂人类的语音,并将人类的语音信息转化为可读的文字信息。“作为一个典型的交叉学科任务,ASR不仅涉及模式识别、信号处理、物理声学、计算机科学、生理学、心理学,还与语言学密切相关”(颜永红,等2013:232),因为计算机对语言的准确处理基于对语言语音特点的清晰认识。国外有学者在进行阿拉伯语的ASR研究时就指出,“我们的实验证明,在缺少语言的专业知识时,只采用数据驱动的方式无法有效地降低阿拉伯语语音识别的错误率”(Enshassi2016:81)。作为一种“派生语言”①,阿拉伯语的语言体系以动词为核心,但动词的语音具有复杂的特点,对阿拉伯语的ASR构成重要挑战。鉴于此,本文以ASR为目的,从语言学视角对阿拉伯语动词的语音特点进行研究。1.阿拉伯语动词语音特点的传统研究思路阿拉伯语作为一门古老的语言,对其动词语音特点的研究由来已久。虽然学界传统的研收稿日期:2020-11-23;作者修订:2022-12-07;本刊修订:2022-12-08基金项目:国家自然科学基金重大项目“多语言言语数据的获取、标注和分析研究”(11590771);河南省哲学社会科学规划项目“面向...