Institute of Computing Technology, Chinese Academy IR
信息检索中的带权邻近度度量研究 | |
程学旗; 薛源海; 俞晓明; 刘悦; 关峰 | |
2014 | |
发表期刊 | 计算机研究与发展 |
ISSN | 1000-1239 |
卷号 | 51.0期号:010页码:2216 |
摘要 | 信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升. |
关键词 | 带权邻近度 度量方法 BM25 查询词重要性 信息检索 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/37408 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 程学旗,薛源海,俞晓明,等. 信息检索中的带权邻近度度量研究[J]. 计算机研究与发展,2014,51.0(010):2216. |
APA | 程学旗,薛源海,俞晓明,刘悦,&关峰.(2014).信息检索中的带权邻近度度量研究.计算机研究与发展,51.0(010),2216. |
MLA | 程学旗,et al."信息检索中的带权邻近度度量研究".计算机研究与发展 51.0.010(2014):2216. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[程学旗]的文章 |
[薛源海]的文章 |
[俞晓明]的文章 |
百度学术 |
百度学术中相似的文章 |
[程学旗]的文章 |
[薛源海]的文章 |
[俞晓明]的文章 |
必应学术 |
必应学术中相似的文章 |
[程学旗]的文章 |
[薛源海]的文章 |
[俞晓明]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论