CSpace  > 中国科学院计算技术研究所期刊论文  > 中文
Geeking:基于胜者表的体育新闻搜索引擎系统
林裕杰1; 陈新荃2; 高妍3; 肖卡飞4; 胡红祥1; 花强5
2016
发表期刊集成技术
ISSN2095-3135
卷号000期号:2页码:97
摘要文章介绍了体育新闻搜索引擎系统Geeking的框架结构和各项功能,其结构分为网页爬取、胜者表构建、检索处理、用户界面4个部分,其主要功能包含查询词校正、自动补全、检索结果排序、相似新闻聚类以及显示页面中关键词高亮并提供网页快照。输入查询请求时,系统根据搜索日志和新闻热词自动补全查询词,搜索不到相关结果时校正查询,给出推荐的查询词。检索新闻文档时,使用胜者表快速查找查询词项的相关文档,综合tf-idf权重和新闻标题、发布时间等因素计算文档的相关性并按得分排序。在相似新闻聚类中,结合最长公共子序列和编辑距离衡量新闻标题之间的相似度,以新闻标题相似度代表新闻文档的相似度。测试结果表明,基于胜者表的Geeking搜索引擎系统各项功能协调效果好,检索响应速度快。
关键词搜索引擎 体育新闻 胜者表 编辑距离 聚类 查询词校正
语种英语
文献类型期刊论文
条目标识符http://119.78.100.204/handle/2XEOYT63/35980
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.深圳先进技术研究院
2.中国科学院上海高等研究院
3.中国科学院计算技术研究所
4.中国科学院沈阳计算技术研究所有限公司
5.河北大学
推荐引用方式
GB/T 7714
林裕杰,陈新荃,高妍,等. Geeking:基于胜者表的体育新闻搜索引擎系统[J]. 集成技术,2016,000(2):97.
APA 林裕杰,陈新荃,高妍,肖卡飞,胡红祥,&花强.(2016).Geeking:基于胜者表的体育新闻搜索引擎系统.集成技术,000(2),97.
MLA 林裕杰,et al."Geeking:基于胜者表的体育新闻搜索引擎系统".集成技术 000.2(2016):97.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[林裕杰]的文章
[陈新荃]的文章
[高妍]的文章
百度学术
百度学术中相似的文章
[林裕杰]的文章
[陈新荃]的文章
[高妍]的文章
必应学术
必应学术中相似的文章
[林裕杰]的文章
[陈新荃]的文章
[高妍]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。