Institute of Computing Technology, Chinese Academy IR
面向舆情事件的子话题标签生成模型ET-TAG | |
周楠; 杜攀; 靳小龙; 刘悦; 程学旗 | |
2018 | |
发表期刊 | 计算机学报 |
ISSN | 0254-4164 |
卷号 | 41.0期号:007页码:1490 |
摘要 | 关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义.事件子话题标签的生成通常包括两个关键步骤:首先发现子话题,然后依据每个子话题的关键词或文档内容生成描述该子话题的有效标签.传统方法在发现话题时多采用聚类或分类的方法,它们将同一个话题的文档整合到一个簇中.然而,由于隶属同一事件的文档具有很强的相似性,现有方法难以度量他们之间的距离,因此无法应用于发现事件子话题这一任务.此外,在为子话题生成标签时,传统的方法通常通过抽取来实现.此类方法所生成标签的准确性无法保证.为此,该文提出了一种基于PLSA with Background Language并结合关键词聚类发现事件内部子话题,进而基于维基百科等知识库生成事件子话题标签的模型ET-TAG.在多类舆情事件数据集上的实验结果表明,ET-TA G算法相比_K-means和LDA等已有子话题发现方法具有更好的性能"0子话题标签生成角度而言,ET-TAG生成的标签相对于传统方法也具有更好的准确性和概括性.该文最后将ET-TAG算法生成的子话题标签用于事件的对比和追踪,结果表明通过子话题标签可以发现事件共性,并反映事件子话题热度的变化趋势. |
关键词 | 子话题发现 PLSA with Background Language 关键词聚类 子话题标签生成 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/25809 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院网络数据科学与技术重点实验室 |
推荐引用方式 GB/T 7714 | 周楠,杜攀,靳小龙,等. 面向舆情事件的子话题标签生成模型ET-TAG[J]. 计算机学报,2018,41.0(007):1490. |
APA | 周楠,杜攀,靳小龙,刘悦,&程学旗.(2018).面向舆情事件的子话题标签生成模型ET-TAG.计算机学报,41.0(007),1490. |
MLA | 周楠,et al."面向舆情事件的子话题标签生成模型ET-TAG".计算机学报 41.0.007(2018):1490. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[周楠]的文章 |
[杜攀]的文章 |
[靳小龙]的文章 |
百度学术 |
百度学术中相似的文章 |
[周楠]的文章 |
[杜攀]的文章 |
[靳小龙]的文章 |
必应学术 |
必应学术中相似的文章 |
[周楠]的文章 |
[杜攀]的文章 |
[靳小龙]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论