分享
信息处理用藏语短语分类与标记规范 GBT 36472-2018.pdf
下载文档

ID:2460743

大小:1.77MB

页数:16页

格式:PDF

时间:2023-06-25

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
信息处理用藏语短语分类与标记规范 GBT 36472-2018 信息处理 藏语 短语 分类 标记 规范 36472 2018
GB/T364722018引言本标准依据藏语传统语法分类体系,根据藏语信息处理的特点和要求,按照语法功能和便于计算机自动分析和处理的原则划分藏语短语词类,并规定了藏语短语标记代码。GB/T36472-2018信息处理用藏语短语分类与标记规范1范围本标准规定了信息处理中藏语短语的类别划分和标记代码。本标准适用于藏文信息处理各领域,其他行业和有关学科可参照使用。2术语和定义下列术语和定义适用于本文件。2.1藏文信息处理Tibetan Information Processing;TIP用计算机对藏文的音、形、义等信息进行处理。2.2短语类别phrase categories短语的语法分类,主要是根据语法功能划分出来的类。2.3标记tag对文本中短语类别进行标注的代码。3总则3.1短语的基本范围本标准的类别特指信息处理用藏语短语类别,如名词性短语(NP)、动词性短语(VP)、形容词性短语(AP)等。3.2短语类别划分的原则本标准针对载语信息处理的特点和要求,依据藏语传统语法分类体系,并参考汉语短语分类研究成果(见参考文献),确定了藏文短语类别划分原则。短语大类之间不应出现交叉,包括标注形式层和语义层:小类间允许出现标注形式层交叉,但不应出现语义层的交叉。3.3标记代码的制定原则依据国际通常做法,标记代码主要采用英文术语的字母。例如,“名词短语”,采用NP;“数词”,采用MP作为标记代码。藏语独有的,或使用英文术语字母标记不便的,依据国内通常做法,标记代码采用汉语拼音字母。如,“判断性短语”,采用汉语拼音的首字母作为标记代码PP。4短语类别的划分及标记代码4.1短语类别的划分本标准将藏语短语划分为名词性短语、动词性短语、形容词性短语、数量词性短语、判断性短语、固

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开