Institute of Computing Technology, Chinese Academy IR
一种支持混合语言的并行查询纠错方法 | |
颛悦; 熊锦华; 马宏远; 程舒杨; 程学旗 | |
2016 | |
发表期刊 | 中文信息学报 |
ISSN | 1003-0077 |
卷号 | 30.0期号:002页码:99 |
摘要 | 中文信息检索系统中的查询语句包含中文字、拼音、英文等多种形式,而有些查询语句过长,不利于纠错处理。现有的查询纠错方法不能很好的解决中文检索系统中的混合语言与中文长查询的问题。为了解决上述两个问题,该文提出了一种支持混合语言的并行纠错方法。该方法通过对混合语言统一编码,建立统一编码语言模型和异构字符词典树,并根据语言特点制定相应的编辑规则对查询词语进行统一处理,其中,针对中文长查询,提出双向并行的纠错模型。为了并行处理查询语句,我们在字符词典树和语言模型的基础上提出了逆向字符词典树和逆向语言模型的概念。模型中使用的训练语料库是从用户查询日志、网页点击日志、网页链接信息等文件中提取的高质量文本。实验表明,与单向查询纠错相比,支持混合语言的并行纠错方法在准确率上提升了9%,召回率降低了3%,在速度上提升了40%左右。 |
关键词 | 查询纠错 词典树 语言模型 并行纠错 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/28813 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院计算技术研究所 2.国家计算机网络应急技术处理协调中心 |
推荐引用方式 GB/T 7714 | 颛悦,熊锦华,马宏远,等. 一种支持混合语言的并行查询纠错方法[J]. 中文信息学报,2016,30.0(002):99. |
APA | 颛悦,熊锦华,马宏远,程舒杨,&程学旗.(2016).一种支持混合语言的并行查询纠错方法.中文信息学报,30.0(002),99. |
MLA | 颛悦,et al."一种支持混合语言的并行查询纠错方法".中文信息学报 30.0.002(2016):99. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[颛悦]的文章 |
[熊锦华]的文章 |
[马宏远]的文章 |
百度学术 |
百度学术中相似的文章 |
[颛悦]的文章 |
[熊锦华]的文章 |
[马宏远]的文章 |
必应学术 |
必应学术中相似的文章 |
[颛悦]的文章 |
[熊锦华]的文章 |
[马宏远]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论