CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
信息检索中的带权邻近度度量研究
程学旗; 薛源海; 俞晓明; 刘悦; 关峰
2014
发表期刊计算机研究与发展
ISSN1000-1239
卷号51.0期号:010页码:2216
摘要信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.
关键词带权邻近度 度量方法 BM25 查询词重要性 信息检索
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/37408
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
第一作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
程学旗,薛源海,俞晓明,等. 信息检索中的带权邻近度度量研究[J]. 计算机研究与发展,2014,51.0(010):2216.
APA 程学旗,薛源海,俞晓明,刘悦,&关峰.(2014).信息检索中的带权邻近度度量研究.计算机研究与发展,51.0(010),2216.
MLA 程学旗,et al."信息检索中的带权邻近度度量研究".计算机研究与发展 51.0.010(2014):2216.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[程学旗]的文章
[薛源海]的文章
[俞晓明]的文章
百度学术
百度学术中相似的文章
[程学旗]的文章
[薛源海]的文章
[俞晓明]的文章
必应学术
必应学术中相似的文章
[程学旗]的文章
[薛源海]的文章
[俞晓明]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。