Institute of Computing Technology, Chinese Academy IR
基于多特征融合和图匹配的维汉句子对齐 | |
倪耀群; 许洪波; 程学旗 | |
2016 | |
发表期刊 | 中文信息学报 |
ISSN | 1003-0077 |
卷号 | 30.0期号:004页码:124 |
摘要 | 维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对齐造成了困难。此外,作为新闻要素的人名地名很多是未登录词,这进一步增加了维汉句子对齐的难度。为了提高维汉词汇的匹配概率,作者自动提取中文人名、地名并翻译为维吾尔译名,构造双语名称映射表并加入维汉双语词典。然后用维文句中词典词对应的中文译词在中文句中进行串匹配,以避免中文分词错误,累计所有匹配词对得到双语句对的词汇互译率。最后融合数字、标点、长度特征计算双语句对的相似度。在所有双语句子相似度构成的矩阵上,使用图匹配算法寻找维汉平行句对,在900个句对上最高达到95.67%的维汉对齐准确率。 |
关键词 | 句子对齐 人名、地名翻译 多特征融合 二部图最佳匹配 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/37202 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 倪耀群,许洪波,程学旗. 基于多特征融合和图匹配的维汉句子对齐[J]. 中文信息学报,2016,30.0(004):124. |
APA | 倪耀群,许洪波,&程学旗.(2016).基于多特征融合和图匹配的维汉句子对齐.中文信息学报,30.0(004),124. |
MLA | 倪耀群,et al."基于多特征融合和图匹配的维汉句子对齐".中文信息学报 30.0.004(2016):124. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[倪耀群]的文章 |
[许洪波]的文章 |
[程学旗]的文章 |
百度学术 |
百度学术中相似的文章 |
[倪耀群]的文章 |
[许洪波]的文章 |
[程学旗]的文章 |
必应学术 |
必应学术中相似的文章 |
[倪耀群]的文章 |
[许洪波]的文章 |
[程学旗]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论