Institute of Computing Technology, Chinese Academy IR
| 基于类别分布的特征选择框架 | |
| 靖红芳1; 王斌1; 杨雅辉2; 徐燕3 | |
| 2009 | |
| 发表期刊 | 计算机研究与发展
![]() |
| ISSN | 1000-1239 |
| 卷号 | 000期号:009页码:1586 |
| 摘要 | 目前已有很多种特征选择方法,但就目前所知,没有一种方法能够在非平衡语料上取得很好的效果。依据特征在类别间的分布特点提出了基于类别分布的特征选择框架。该框架能够利用特征的分布信息选出具有较强区分能力的特征,同时允许给类别灵活地分配权重,分配较大的权重给稀有类别则提高稀有类别的分类效果,所以它适用于非平衡语料,也具有很好的扩展性。另外,OCFS和基于类别分布差异的特征过滤可以看作该框架的特例。实现该框架得到了具体的特征选择方法,Retuers-21578语料及复旦大学语料等两个非平衡语料上的实验表明,它们的Macro和Micro F1效果都优于IG,CHI和OCFS。 |
| 关键词 | 特征选择 非平衡语料 特征降维 文本分类 数据挖掘 |
| 语种 | 英语 |
| 文献类型 | 期刊论文 |
| 条目标识符 | http://119.78.100.204/handle/2XEOYT63/36110 |
| 专题 | 中国科学院计算技术研究所期刊论文_中文 |
| 作者单位 | 1.中国科学院计算技术研究所 2.北京大学软件与微电子学院 3.北京语言大学网络信息与教育技术中心 |
| 第一作者单位 | 中国科学院计算技术研究所 |
| 推荐引用方式 GB/T 7714 | 靖红芳,王斌,杨雅辉,等. 基于类别分布的特征选择框架[J]. 计算机研究与发展,2009,000(009):1586. |
| APA | 靖红芳,王斌,杨雅辉,&徐燕.(2009).基于类别分布的特征选择框架.计算机研究与发展,000(009),1586. |
| MLA | 靖红芳,et al."基于类别分布的特征选择框架".计算机研究与发展 000.009(2009):1586. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [靖红芳]的文章 |
| [王斌]的文章 |
| [杨雅辉]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [靖红芳]的文章 |
| [王斌]的文章 |
| [杨雅辉]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [靖红芳]的文章 |
| [王斌]的文章 |
| [杨雅辉]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论