Institute of Computing Technology, Chinese Academy IR
维吾尔语词法分析的有向图模型 | |
麦热哈巴艾力1; 姜文斌2; 王志洋2; 吐尔根依布拉音1; 刘群2 | |
2012 | |
发表期刊 | 软件学报 |
ISSN | 1000-9825 |
卷号 | 23.0期号:012页码:3115 |
摘要 | 维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词的层次结构引入到词法分析研究中,提出了维吾尔语词法分析的有向图模型,该模型将维吾尔语词法分析描述为有向图结构,图中节点表示词干、词缀及其相应标注,其边表示节点之间的转移或生成概率并将此概率作为候选择优的依据.针对维吾尔语在形态变化过程中发生的音变现象,又提出基于词内字母对齐算法的自动还原模型,该模型将音变现象泛化到每个字母上的假设之下,将还原问题转变成类似于词性标注问题,再利用统计方法进行还原.在对新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上进行的实验中,取得了词干提取正确率为94.7%,词干与各词缀切分并标注的F值达到92.6%的好成绩. |
关键词 | 维吾尔语 词法分析 词语切分 词性标注 有向图 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/29439 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.新疆大学信息科学与工程学院 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 麦热哈巴艾力,姜文斌,王志洋,等. 维吾尔语词法分析的有向图模型[J]. 软件学报,2012,23.0(012):3115. |
APA | 麦热哈巴艾力,姜文斌,王志洋,吐尔根依布拉音,&刘群.(2012).维吾尔语词法分析的有向图模型.软件学报,23.0(012),3115. |
MLA | 麦热哈巴艾力,et al."维吾尔语词法分析的有向图模型".软件学报 23.0.012(2012):3115. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[麦热哈巴艾力]的文章 |
[姜文斌]的文章 |
[王志洋]的文章 |
百度学术 |
百度学术中相似的文章 |
[麦热哈巴艾力]的文章 |
[姜文斌]的文章 |
[王志洋]的文章 |
必应学术 |
必应学术中相似的文章 |
[麦热哈巴艾力]的文章 |
[姜文斌]的文章 |
[王志洋]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论