Institute of Computing Technology, Chinese Academy IR
一种提高维吾尔语-汉语词语对齐的方法研究 | |
麦热哈巴艾力1; 王志洋2; 吐尔根依布拉音1 | |
2012 | |
发表期刊 | 小型微型计算机系统 |
ISSN | 1000-1220 |
卷号 | 33期号:11页码:2551 |
摘要 | 维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示方法,使得词缀呈现相同的形式.通过以上方法欲达到抑制维汉词语对齐中数据稀疏现象.本文利用此方法处理了新疆多语种信息技术重点实验室提供的维汉双语语料,再利用GIZA++进行对齐,试验结果表明,此方法对词语对齐效果起到了明显的积极作用,而且对维汉机器翻译的质量也有显著的提高. |
关键词 | 词对齐 维吾尔语 形态分析 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/34682 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.新疆大学信息科学与工程学院 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 麦热哈巴艾力,王志洋,吐尔根依布拉音. 一种提高维吾尔语-汉语词语对齐的方法研究[J]. 小型微型计算机系统,2012,33(11):2551. |
APA | 麦热哈巴艾力,王志洋,&吐尔根依布拉音.(2012).一种提高维吾尔语-汉语词语对齐的方法研究.小型微型计算机系统,33(11),2551. |
MLA | 麦热哈巴艾力,et al."一种提高维吾尔语-汉语词语对齐的方法研究".小型微型计算机系统 33.11(2012):2551. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[麦热哈巴艾力]的文章 |
[王志洋]的文章 |
[吐尔根依布拉音]的文章 |
百度学术 |
百度学术中相似的文章 |
[麦热哈巴艾力]的文章 |
[王志洋]的文章 |
[吐尔根依布拉音]的文章 |
必应学术 |
必应学术中相似的文章 |
[麦热哈巴艾力]的文章 |
[王志洋]的文章 |
[吐尔根依布拉音]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论