Institute of Computing Technology, Chinese Academy IR
一种基于时序窗口的动态热点话题提取模型 | |
马慧芳1; 尹旻2; 何清3; 史忠植3 | |
2010 | |
发表期刊 | 高技术通讯 |
ISSN | 1002-0470 |
卷号 | 000期号:006页码:590 |
摘要 | 针对新闻领域的专题组织进行了研究,提出了一种基于时序窗口的动态热点话题提取模型。该模型整合了热点话题的两个特点。一方面关注主题词在新闻文本中的广泛性,衡量标准为多频道播报特征项的频率综合,词频越高其广泛性越高;另一方面考虑新闻流主题词的突发性,表现为特定时间段内主题词出现频率显著异常于其它时间段。引入时序窗口进行上升和下降突发模式提取,并结合TF-DF作为主题词赋权值依据。实验结果表明,这种基于时序窗口的动态热点话题提取模型对新闻文本进行主题抽取具有很好的性能。 |
关键词 | 话题提取 时序窗口 广泛性 突发性 TF-PDF |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/29619 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院大学 2.联想研究院 3.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 马慧芳,尹旻,何清,等. 一种基于时序窗口的动态热点话题提取模型[J]. 高技术通讯,2010,000(006):590. |
APA | 马慧芳,尹旻,何清,&史忠植.(2010).一种基于时序窗口的动态热点话题提取模型.高技术通讯,000(006),590. |
MLA | 马慧芳,et al."一种基于时序窗口的动态热点话题提取模型".高技术通讯 000.006(2010):590. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[马慧芳]的文章 |
[尹旻]的文章 |
[何清]的文章 |
百度学术 |
百度学术中相似的文章 |
[马慧芳]的文章 |
[尹旻]的文章 |
[何清]的文章 |
必应学术 |
必应学术中相似的文章 |
[马慧芳]的文章 |
[尹旻]的文章 |
[何清]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论