Institute of Computing Technology, Chinese Academy IR
求解大规模谱聚类的近似加权核k-means算法 | |
贾洪杰1; 丁世飞1; 史忠植2 | |
2015 | |
发表期刊 | 软件学报 |
ISSN | 1000-9825 |
卷号 | 26.0期号:011页码:2836 |
摘要 | 谱聚类将聚类问题转化成图划分问题,是一种基于代数图论的聚类方法.在求解图划分目标函数时,一般利用Rayleigh熵的性质,通过计算Laplacian矩阵的特征向量将原始数据点映射到一个低维的特征空间中,再进行聚类.然而在谱聚类过程中,存储相似矩阵的空间复杂度是O(n2),对Laplacian矩阵特征分解的时间复杂度一般为O(n3),这样的复杂度在处理大规模数据时是无法接受的.理论证明,Normalized Cut图聚类与加权核k-means都等价于矩阵迹的最大化问题.因此,可以用加权核k-means算法来优化Normalized Cut的目标函数,这就避免了对Laplacian矩阵特征分解.不过,加权核k-means算法需要计算核矩阵,其空间复杂度依然是O(n2).为了应对这一挑战,提出近似加权核k-means算法,仅使用核矩阵的一部分来求解大数据的谱聚类问题.理论分析和实验对比表明,近似加权核k-means的聚类表现与加权核k-means算法是相似的,但是极大地减小了时间和空间复杂性. |
关键词 | 谱聚类 迹最大化 加权核k-means 近似核矩阵 大数据 |
语种 | 英语 |
文献类型 | 期刊论文 |
条目标识符 | http://119.78.100.204/handle/2XEOYT63/36726 |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国矿业大学 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 贾洪杰,丁世飞,史忠植. 求解大规模谱聚类的近似加权核k-means算法[J]. 软件学报,2015,26.0(011):2836. |
APA | 贾洪杰,丁世飞,&史忠植.(2015).求解大规模谱聚类的近似加权核k-means算法.软件学报,26.0(011),2836. |
MLA | 贾洪杰,et al."求解大规模谱聚类的近似加权核k-means算法".软件学报 26.0.011(2015):2836. |
条目包含的文件 | 条目无相关文件。 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[贾洪杰]的文章 |
[丁世飞]的文章 |
[史忠植]的文章 |
百度学术 |
百度学术中相似的文章 |
[贾洪杰]的文章 |
[丁世飞]的文章 |
[史忠植]的文章 |
必应学术 |
必应学术中相似的文章 |
[贾洪杰]的文章 |
[丁世飞]的文章 |
[史忠植]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论