分享
阿拉伯语数字化发展问题刍议:意义、现状与挑战.pdf
下载文档

ID:2747738

大小:1.71MB

页数:3页

格式:PDF

时间:2023-11-29

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
阿拉伯语 数字化 发展 问题 刍议 意义 现状 挑战
阿拉伯语数字化发展问题刍议:意义、现状与挑战摘 要:文章围绕阿拉伯语数字化的意义、现状与面临的挑战进行初步探索。首先叙述了阿拉伯语数字化对保护语言与文化遗产、弥合数字语言鸿沟、提升区域联通水平的意义;其次概括和总结了阿拉伯语数字化在网页网站、数字资源、信息工具方面的现状和问题;最后指出了阿拉伯语数字化仍旧面临发展水平制约、多语环境影响、语言学会作用缺失、数字化技术阻滞等挑战。但是可以预见,未来阿拉伯语数字化领域具有巨大发展潜力。关键词:阿拉伯语;数字化;阿拉伯国家;民族文化认同中图分类号:H0文献标识码:A文章编号:2095-0438(2023)03-0087-03(扬州大学外国语学院江苏扬州225127)近年来学界对阿拉伯国家语情的关注持续高涨,但是对数字时代背景下的语情动态则鲜少涉及。事实上,阿拉伯国家早已意识到语言资源的重要性与语言数字化的必要性,近20年来推出了诸多支持阿拉伯语数字化发展的举措,如联合国西亚经济社会委员会的阿拉伯语数字内容倡议、阿拉伯教科文组织发布的阿拉伯国家信息化战略、维基百科医学和科学术语阿拉伯语化倡议、阿布扎比媒体区支持的推特倡议、阿卜杜拉国王阿拉伯语数字内容倡议、穆罕默德本拉希德国际基金会的百万阿拉伯程序员倡议等,该议题已成为阿拉伯国家关注的焦点。一、阿拉伯语数字化的意义(一)保护语言与文化遗产。历史上,阿拉伯语曾作为整个中东的政治、科学和文学语言,以及西方文明世界的学术文化用语之一,在分裂及外部控制的共同影响下,阿拉伯语逐渐僵滞萎缩,地位显著下降。阿拉伯语数字化的首要动因就是保护语言与文化遗产。一方面可以为子孙后代保存纸质书籍,保护语言与文化遗产记忆;另一方面通过在网络空间构建数字语言文化景观,扩大受众接触阿拉伯传统的新维度,增添语言发展活力。(二)弥合数字语言鸿沟。近年来阿拉伯语网络用户体量庞大且不断上涨。2020年阿拉伯语网络用户数量已达约2.37亿。2021年阿拉伯语网络用户数量占比已从2015年的0.8%跃升至4.8%。1但是,与之不相称的是日益凸显的数字语言鸿沟问题,表现为阿拉伯语数字内容的缺乏与薄弱,翻译和术语阿拉伯化问题,阿拉伯语检索信息、输入字段、显示文本的问题,部分地区互联网和信息基础设施不可及问题等。阿拉伯语数字化程度还远未达到基准水平,而对其数字化的需求却在急剧增加。通过阿拉伯语数字化,引入区域语言支持,不仅能提升用户接受度,还能改善用户体验度,从而进一步增加阿拉伯语网络用户的数量,帮助更多阿拉伯语网络用户获取所需的知识和信息。(三)提升区域联通水平。据统计,阿拉伯语使用国家数量有60个(2015),仅次于英语;将其作为官方语言的国家数量有26个(2018)。2其使用者主要分布于阿拉伯地区及其邻近地区,以及世界各地的阿拉伯移民聚居区。需要指出的是,阿拉伯语作为伊斯兰文化的表征和载体,对其他区域的穆斯林也具有特殊意义,因为它既是 古兰经 和圣训的语言,也是履行宗教功修的用语。在上述区域的交流合作中,语言群体认同发挥着不可替代的重要作用。通过发展阿拉伯语数字化,有助于提升阿拉伯语在国际层面和区域层面的语言地位,强化阿拉伯地古萍盛雪妍季怡萍 第43卷第3期绥 化 学 院 学 报2023年3月Vol.43No.3Journal of Suihua UniversityMar.2023收稿日期:2022-06-13作者简介:古萍(1986-),女,安徽芜湖人,扬州大学外国语学院讲师,博士,研究方向:北非区域国别研究;盛雪妍(1997-),女,山东青岛人,扬州大学外国语学院硕士研究生在读,研究方向:阿拉伯国家语言规划研究;季怡萍(1998-),女,江苏无锡人,扬州大学外国语学院硕士研究生在读,研究方向:阿拉伯国家语言规划研究。基金项目:扬州大学2022年度大学生学术科技创新基金资助项目“语言资源数字化视角下阿拉伯语语言学会的作用研究”阶段性成果。87区的民族文化认同与区域内聚力,获得来自共同信仰的世界穆斯林群体的认同和支持,从而促进阿拉伯国家的整体利益,提升语言辐射区域联通水平。二、阿拉伯语数字化的现状(一)阿拉伯语网页网站。研究表明,自互联网诞生以来网页总数平均值为745亿,阿拉伯语网页页数平均值为6.6亿,阿拉伯语网络内容占比仅为0.89%;20102014年阿拉伯语网络内容量占全球网络内容量的年度百分比分别为3.26%、2.89%、3.25%、4.06%、2.74%。3可见,阿拉伯语网页网站内容量少,在全球网络内容量中占比低。虽然暂无阿拉伯语网络内容最新统计数据,但是作为现有唯一量化研究,上述数据仍具有一定参考价值。需要指出的是,阿拉伯语网页网站流行度低但流量高。据2021 年“网站内容语言的使用统计和市场份额”调查,仅有1.2%的网站使用阿拉伯语;而有62.8%的网站使用英语。虽然较少网站使用阿拉伯语,但是阿拉伯语在高流量网站所用语言中超过了英语,使用阿拉伯语的热门网站包括脸书、维基、雅虎、微软、推特等。4(二)阿拉伯语数字资源。1.数字图书馆。阿拉伯语数字图书馆经过不断发展,尤其是加强与其他图书馆、出版机构、国外大学间的合作,内容更丰富、功能更完善、形态更多元。2015年阿拉伯技术新闻门户发布8个最重要的阿拉伯语数字图书馆:世界数字图书馆、耶鲁大学阿拉伯中东图书馆、汉达维图书馆、阿布扎比电子村倡议、当代埃及记忆、卡塔尔数字图书馆、惠康手稿图书馆、萨哈尔集团文学文化杂志档案。2020年艾布 纳瓦夫网发布7个最重要的免费阿拉伯语数字图书馆,除2015年发布的前四个图书馆外,还包括网上阿拉伯大全、法赫德国王国家电子图书馆、沙特数字图书馆。数字图书馆中以阿联酋和沙特所属居多,这两个国家也是阿拉伯国家阿拉伯语数字化的佼佼者。数字图书馆采纳了数字化理念,认可其在复兴阿拉伯遗产中的作用,积极践行阿拉伯语书刊文献数字化。2.数字百科全书。较为知名的阿拉伯语数字百科全书,包括内容百科全书、知识百科全书、世界阿拉伯语百科全书、维基百科阿拉伯语版、阿卜杜拉 本 阿卜杜 阿齐兹国王阿拉伯健康百科全书、阿拉伯百科大全等。然而,无论在数量还是内容与质量上,阿拉伯语数字百科全书与西方语言特别是英语的数字百科全书之间仍有较大差距。(三)阿拉伯语信息工具。阿拉伯语搜索引擎有穆希德、法罕里斯、萨哈、艾因、阿拉伯之门、库努兹、曼萨尔网、萨赫勒。其中,艾因采用与国际搜索引擎类似的信息主题分类法。萨赫勒与国际搜索引擎中的呈现方式相同。5事实上,阿拉伯语收词量相当大,但是,大多数阿拉伯语词典是“历史”词典,语言似乎限制或停滞在那些时代,而现实需要新词和新表达,因此它对现代科学、媒体表达和街头用语并无较大帮助。6三、阿拉伯语数字化的挑战(一)发展水平制约。2006年12月阿拉伯教科文组织发布阿拉伯国家信息化战略,总结了阿拉伯国家进入信息知识社会面临的诸多挑战,包括数字鸿沟、数字内容的投资疲软、阿拉伯信息内容和研发活动的缺乏、研究工作的孤立,以及许多阿拉伯国家通信基础设施的地理不平衡。此外,因发展水平落后形成的自卑也是阿拉伯语网络内容薄弱的因素之一,很多阿拉伯语网络用户在数字世界倾向使用英语、法语等。据国际电信联盟发布的 衡量数字发展:事实与数据2020,阿拉伯国家4G和3G人口覆盖率分别为61.9%、28.9%;4G、3G和2G农村覆盖率分别为44%、34%、10%,4G、3G城市覆盖率分别为76%、24%;城市和农村互联网接入的家庭占比分别为74%、38%;城市和农村电脑接入的家庭占比分别为67%、34%。7受发展水平制约,移动电话和互联网接入价格高昂使得购买力普遍降低。互联网基础设施特别是宽带服务薄弱,无法激励阿拉伯语数字内容的发展和使用。(二)多语环境影响。多语环境对阿拉伯语数字化的不利影响体现在两方面:一是数字媒体中阿拉伯语的妄用与误用,如“使用方言;用数字替代阿拉伯语字母;语法和拼写错误盛行;使用缩略词、简写词或是多次重复单词中的某个字母等”8。二是社交媒体中阿拉伯语的代写。代写阿拉伯语并非新兴现象,已具有一定的历史社会基础。从 20 世纪初的达乌德 沙拉比,到40年代的阿卜杜勒 阿齐兹 法赫米,再到60年代的赛义德 阿克尔,用拉丁字母书写或转写阿拉伯语字母的呼吁和实践一直存在。而随着社交媒体和手机的出现、普及与传播,阿拉伯青年发明了阿拉伯提尼语,即用拉丁字母与数字书写阿拉伯语。例如,将阿拉伯语中的爱写为7b,月亮写为2mar,阿拉伯人写为3arabi等。当前这种语言现象正在蔓延,其优势在于便捷和快速,但是也必然对阿拉伯语特别是其字母构成威胁。(三)语言学会作用缺失。为了实现各个语言学会间的交流、协调及组织工作,1971 年成立了一个统一的实体机构阿拉伯语语言学会联盟及其理事会。当时,该联盟成员包括11个阿拉伯语语言学会(毛里塔尼亚、大马士革、开罗、巴格达、约旦、摩洛哥、突尼斯、巴勒斯坦、苏丹、利比亚、阿尔及利亚)。随着时代发展,2012年沙特甚至成立了网上阿拉伯语学会。阿拉伯语语言学会是保护、支持和发展阿拉伯语的重要灯塔,为推广、规范阿拉伯语提供了有力的组织保证,尤其在统一各个学会批准的科学、技术和文化术语方面作出了重要贡献。在全球化和西化潮流下,阿拉伯语语言学会的两大主要工作即阿化和翻译难以得到认可与支持,阿化的现实价值、翻译的创新性与时效性成为人们质疑的焦点,而舆论、教育机构、媒体及其他机构也很少遵循或使用已经阿化的科学术语,使得这些术语只能半死亡地待在专业词典里。与此同时,阿拉伯语语言学会缺乏现代化机制和现代术语标准,各个语言学会之间也缺乏务实有效的协作。88(四)数字化技术阻滞。目前阿拉伯国家缺乏发展数字内容产业所需的技术和技能基础。9以文字编码倡议(TEI)国际标准为例,它是图书馆、信息中心和档案库进行资源数字化时最常用的重要国际标准,主要使用Unicode作为字符编码系统,但使用TEI国际标准对阿拉伯语文稿进行数字化处理时,会面临编码与编目两大问题,表现在阿拉伯语字母的输入、阿拉伯语字母间的连接、双向文本的打印和显示等。目前常用的一种间接解决方案是,借助可直接与TEI标准兼容的附加字符和编码,并将其写入外部文件。10阿拉伯语具有与大多数其他语言不同的语言特征,很大程度上被动地造成语言数字化技术阻滞。一是从右往左的书写顺序。西方语言以从左往右书写的希腊语和拉丁语为基础;而阿拉伯语基于从右到左书写的迦南字母。影响阿拉伯语书写顺序的原因包括早期书写材料、文化传统及粘连字母等;二是派生构词法。“阿拉伯语的最大特点是使用灵活及派生词多。”11“派生是运用阿拉伯语已有词式,从一个词构成另一个词(新词),通过根词意义和词式意义共同表达新词的意义。它是阿拉伯语主要的扩词手段。”12对于词汇量丰富的阿拉伯语,派生构词法使得阿拉伯语数字化时无法快速定位。结语随着阿拉伯语网络用户数量的不断增长,加之人口年轻化、政府发展数字化的意愿、本土语言内容的吸引力、科学技术的进步及英语数字化的经验借鉴等,可以预见,阿拉伯语数字化领域将展现巨大发展潜力,多元主体势必进一步参与阿拉伯语数字化进程之中。更有阿拉伯学者指出,应该抓住数字时代的机遇,将阿拉伯语打造为网络通用数字语言。但是,这种愿景的实现与保障,如网络空间的法律监管、数字内容的提供和运营等,还需要构建一个“区域统筹、政府主导、社会参与、多方协作”的发展机制。参考文献:1尼古拉斯 西萨尼斯.2021年互联网上使用的前10种语言 EB/OL.https:/ 瓦来德 伊玛目.阿拉伯语的数字化挑战EB/OL.https:/ 圣萨法赫 达菲里.数字化发展背景下成人阿拉伯语教育危机管理要求J.BouhouthMagazine,2020(32).9穆罕默德 拉明 布丹等.通过数字媒体空间传播阿拉伯语的手段:问题、要求和前景J/OL.http:/ Status and Challenges of Arabic Digitaliz ationaduate CollegesGu Ping Sheng Xueyan Ji Yiping(College of Internatio

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开