| 抑制背景噪声的LDA子话题挖掘算法 |
| 李静远1; 丘志杰1; 刘悦1 ; 程学旗1; 任彦2
|
| 2017
|
发表期刊 | 华南理工大学学报:自然科学版
|
ISSN | 1000-565X
|
卷号 | 45.0期号:003页码:54 |
摘要 | 专题文章集合是一些拥有相似背景知识的文章集合.为了更好地从专题文章集合内部的复杂信息关联中高效挖掘子话题信息,文中提出了抑制背景噪声的线性判别分析(LDA)子话题挖掘算法BLDA,通过预先抽取专题文档集合的共同背景知识、在迭代过程中重设关键词的产生等方式提高子话题抽取的准确程度.在微信公众账号文章上的系列实验证明,BLDA算法针对有共同背景的专题文章集合的聚类结果显著优于传统的LDA算法,其中主题召回率提高了170%,Purity聚类指标提高了143%,NMI聚类指标提高了160%. |
关键词 | 子话题挖掘
线性判别分析
背景噪声抑制
|
语种 | 英语
|
文献类型 | 期刊论文
|
条目标识符 | http://119.78.100.204/handle/2XEOYT63/37538
|
专题 | 中国科学院计算技术研究所期刊论文_中文
|
作者单位 | 1.中国科学院计算技术研究所 2.国家计算机网络应急技术处理协调中心
|
第一作者单位 | 中国科学院计算技术研究所
|
推荐引用方式 GB/T 7714 |
李静远,丘志杰,刘悦,等. 抑制背景噪声的LDA子话题挖掘算法[J]. 华南理工大学学报:自然科学版,2017,45.0(003):54.
|
APA |
李静远,丘志杰,刘悦,程学旗,&任彦.(2017).抑制背景噪声的LDA子话题挖掘算法.华南理工大学学报:自然科学版,45.0(003),54.
|
MLA |
李静远,et al."抑制背景噪声的LDA子话题挖掘算法".华南理工大学学报:自然科学版 45.0.003(2017):54.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论