Institute of Computing Technology, Chinese Academy IR
文档检索中句法信息的有效利用研究 | |
丁凡; 王斌; 白硕; 刘宜轩; 李亚楠 | |
2008 | |
发表期刊 | 中文信息学报 |
ISSN | 1003-0077 |
卷号 | 22.0期号:004页码:66 |
摘要 | 利用词项依存关系来改进词袋模型,一直是文本检索中一个热门话题。已有的定义词项依存的方法中,有两类主要的方法:一类是词汇层次的依存关系,利用统计近邻信息来定义词项依存关系,另一类是句法层次的依存关系,由句法结构来定义词项依存关系。虽然已有的研究表明,相对于词袋模型,利用词项依存关系能够显著地提高检索性能,但这两类词项依存关系却缺乏系统的比较:在利用词项依存关系来改进文档和查询的表达上,如何有效地利用句法信息,哪些句法信息对文本检索比较有效,依然是个有待研究的问题。为此,在文档表达上,比较了利用近邻信息和句法信息定义的词项依存关系的性能;在查询表达上,对利用不同层次的句法信息所定义的词项依存关系的性能进行了比较。为了系统地比较这些词项依存关系对检索性能的影响,在语言模型基础上,以平滑为思路,提出了一个能方便融入这两类词项依存关系的检索模型。在TREC语料上的实验表明,对于文档表达来说,句法关系较统计近邻关系没有明显的差别。在查询表达上,基于名词/专有词短语的部分句法信息较其他的句法信息更加有效。 |
关键词 | 计算机应用 中文信息处理 信息检索 词项依存 句法分析 词项近邻 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/35760 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 丁凡,王斌,白硕,等. 文档检索中句法信息的有效利用研究[J]. 中文信息学报,2008,22.0(004):66. |
APA | 丁凡,王斌,白硕,刘宜轩,&李亚楠.(2008).文档检索中句法信息的有效利用研究.中文信息学报,22.0(004),66. |
MLA | 丁凡,et al."文档检索中句法信息的有效利用研究".中文信息学报 22.0.004(2008):66. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[丁凡]的文章 |
[王斌]的文章 |
[白硕]的文章 |
百度学术 |
百度学术中相似的文章 |
[丁凡]的文章 |
[王斌]的文章 |
[白硕]的文章 |
必应学术 |
必应学术中相似的文章 |
[丁凡]的文章 |
[王斌]的文章 |
[白硕]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论