Institute of Computing Technology, Chinese Academy IR
基于词类和搭配的微博舆情文本聚类方法研究 | |
王恒静1; 曹存根2; 高尚1 | |
2015 | |
发表期刊 | 南京师大学报:自然科学版 |
ISSN | 1001-4616 |
卷号 | 38.0期号:1.0页码:57 |
摘要 | 微博是近年出现的新型互联网信息交流平台,它具有主题分散、体量短小、文体自由等特性,它能对社会产生巨大的影响,所以信息监管部门和商业企业对基于微博信息的舆情分析都有迫切需求.提出了基于搭配的文本聚类新方法,该方法先进行微博文本预处理,然后利用词类模型进行自动抽取有效搭配,最后基于有效搭配的模型进行文本聚类.实验证明利用词类文本聚类方法比传统文本聚类方法性能提高6.3%,而本文方法比利用词类文本聚类方法性能提升了16.8%,结果显示了本方法的有效性. |
关键词 | 微博舆情分析 词义类簇 搭配 相似度 文本聚类 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/36202 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.江苏科技大学 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 王恒静,曹存根,高尚. 基于词类和搭配的微博舆情文本聚类方法研究[J]. 南京师大学报:自然科学版,2015,38.0(1.0):57. |
APA | 王恒静,曹存根,&高尚.(2015).基于词类和搭配的微博舆情文本聚类方法研究.南京师大学报:自然科学版,38.0(1.0),57. |
MLA | 王恒静,et al."基于词类和搭配的微博舆情文本聚类方法研究".南京师大学报:自然科学版 38.0.1.0(2015):57. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[王恒静]的文章 |
[曹存根]的文章 |
[高尚]的文章 |
百度学术 |
百度学术中相似的文章 |
[王恒静]的文章 |
[曹存根]的文章 |
[高尚]的文章 |
必应学术 |
必应学术中相似的文章 |
[王恒静]的文章 |
[曹存根]的文章 |
[高尚]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论