Institute of Computing Technology, Chinese Academy IR
基于监督学习的中文情感分类技术比较研究 | |
唐慧丰; 谭松波; 程学旗 | |
2007 | |
发表期刊 | 中文信息学报 |
ISSN | 1003-0077 |
卷号 | 21.0期号:006页码:88 |
摘要 | 情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,其中各种有监督学习方法的分类效果以及文本特征表示方法和特征选择机制等因素对分类性能的影响更是亟待研究的问题。本文以n-gram以及名词、动词、形容词、副词作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,以中心向量法、KNN、Winnow、Naive Bayes和SVM作为不同的文本分类方法,在不同的特征数量和不同规模的训练集情况下,分别进行了中文情感分类实验,并对实验结果进行了比较,对比结果表明:采用BiGrams特征表示方法、信息增益特征选择方法和SVM分类方法,在足够大训练集和选择适当数量特征的情况下,情感分类能取得较好的效果。 |
关键词 | 计算机应用 中文信息处理 情感分类 文本分类 语言模型 中文信息处理 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/37204 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
第一作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 唐慧丰,谭松波,程学旗. 基于监督学习的中文情感分类技术比较研究[J]. 中文信息学报,2007,21.0(006):88. |
APA | 唐慧丰,谭松波,&程学旗.(2007).基于监督学习的中文情感分类技术比较研究.中文信息学报,21.0(006),88. |
MLA | 唐慧丰,et al."基于监督学习的中文情感分类技术比较研究".中文信息学报 21.0.006(2007):88. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[唐慧丰]的文章 |
[谭松波]的文章 |
[程学旗]的文章 |
百度学术 |
百度学术中相似的文章 |
[唐慧丰]的文章 |
[谭松波]的文章 |
[程学旗]的文章 |
必应学术 |
必应学术中相似的文章 |
[唐慧丰]的文章 |
[谭松波]的文章 |
[程学旗]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论