CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
蒙古语有向图形态分析器的判别式词干词缀切分
姜文斌1; 吴金星1; 乌日力嘎1; 那顺乌日图2; 刘群1
2011
发表期刊中文信息学报
ISSN1003-0077
卷号25.0期号:004页码:30
摘要蒙古语形态分析中,我们之前的有向图模型取得了较高的性能。这种建模方式以图状结构刻画句中词干和词缀之间的概率关系,从而借助上下文信息为每个词确定最佳的切分标注候选。为每个词尽可能地枚举出所有合法的切分标注候选,是有向图模型有效工作的前提。该文提出了一种基于判别式分类的词干词缀切分策略,与之前基于词干表和词缀表的枚举方案相比,该方法对于词中含有未登录词干的情形具有更好的泛化能力。以20万词规模的三级标注人工语料库为训练数据,采用判别式词干词缀切分的有向图形态分析器,对于含有未登录词干的情形,词级切分标注正确率提高了7个百分点。
关键词蒙古语 词法分析 词性标注 词干提取 有向图 判别式
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/30898
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.中国科学院计算技术研究所
2.内蒙古大学蒙古学学院
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
姜文斌,吴金星,乌日力嘎,等. 蒙古语有向图形态分析器的判别式词干词缀切分[J]. 中文信息学报,2011,25.0(004):30.
APA 姜文斌,吴金星,乌日力嘎,那顺乌日图,&刘群.(2011).蒙古语有向图形态分析器的判别式词干词缀切分.中文信息学报,25.0(004),30.
MLA 姜文斌,et al."蒙古语有向图形态分析器的判别式词干词缀切分".中文信息学报 25.0.004(2011):30.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[姜文斌]的文章
[吴金星]的文章
[乌日力嘎]的文章
百度学术
百度学术中相似的文章
[姜文斌]的文章
[吴金星]的文章
[乌日力嘎]的文章
必应学术
必应学术中相似的文章
[姜文斌]的文章
[吴金星]的文章
[乌日力嘎]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。