分享
信息处理用藏文分词规范 GBT 36452-2018.pdf
下载文档

ID:2480525

大小:2.57MB

页数:20页

格式:PDF

时间:2023-06-25

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
信息处理用藏文分词规范 GBT 36452-2018 信息处理 藏文 分词 规范 36452 2018
GB/T36452-2018信息处理用藏文分词规范1范围本标准规定了信息处理用藏文分问规范。本标准适用于藏文信息处理各领域,其他行业和有关学科可参照使用。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T36337一2018信息处理用藏语词类标记集3术语和定义下列术语和定义适用于本文件。3.1司word区别事物意义的量小的语法单位。3.2词组phrase两个或更多词组合成的语言单位。注:词组可以是实词与实词的组合,也可以是实词和虚词的组合,3.3藏文信息处理Tibetan information processing:TIP用计算机对藏文的音、形、义等信息进行处理。3.4分词单位segment unit在分词过程中出现的词。注:分词单位不仅限于语法词,其中也包含了信息处理所需的一部分结合紧密、使用稳定的词组,3.5藏文分词Tibetan segmentation将连续的藏文音节序列按照一定的规范重新组合词序列的过程。4分词规范4.1藏文分词单位和词类的标记本标准以“”作为藏文分词单位的标记,藏语词类标记依据GB/T36337一2018的规定。4.2一般名词r四巧5可cP(nn)4.2.1由单音节名词和单音节形容词组成的词为一个分词单位,1

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开