帮助 关于我们

返回检索结果

基于密度比例的密度峰值聚类算法
Clustering by fast search and find of density peaks based on density-raito

查看参考文献17篇

高诗莹 1   周晓锋 2   李帅 2  
文摘 CFSFDP(Clustering by Fast Search and Find of Density Peaks)是一种新的基于密度的聚类算法。该算法可以对非球形分布的数据聚类,有待调节参数少、聚类速度快等优点。但是对于类簇间密度相差较大的数据,该算法容易遗漏密度较小的类簇而影响聚类的准确率。针对这一问题,提出了基于密度比例峰值聚类算法即R-CFSFDP。该算法将密度比例引入到CFSFDP中,通过计算样本数据的密度比峰值来提高数据中密度较小类簇的辨识度,进而提升整体聚类的准确率。基于9个常用测试数据集(2个人工合成数据集,7个UCI数据集)的聚类实验结果表明,对于类簇间密度相差较大和类簇形状复杂的数据聚类问题,R-CFSFDP能够使得类簇中心更加清晰、易确定,聚类结果更好。
其他语种文摘 CFSFDP(Clustering by Fast Search and Find of Density Peaks)is a new density-based clustering algorithm, which can cluster the non-spherical data with fewer parameters and high speed of clustering. However, when the density of different clusters vary widely, it is hard to find the clusters with sparse density, so that the accuracy of clustering will be decreased. To solve this problem, this paper proposes a density-raito based CFSFDP that short of R-CFSFDP. In this algorithm, the density-ratio is introduced into CFSFDP to make clusters with sparse density easily identifiable. To validate the algorithm, experiments are conducted with 9 data sets (2 synthetic data sets, 7 UCI data sets). The experimental results show that, when the cluster shape is complex and the density of different clustersvary widely, it makes the cluster centers easier to be determined and has a higher accuracy of the clustering than CFSFDP.
来源 计算机工程与应用 ,2017,53(16):10-17 【扩展库】
DOI 10.3778/j.issn.1002-8331.1704-0227
关键词 聚类 ; 密度峰值 ; 密度比例 ; 密度变化
地址

1. 东北大学计算机科学与工程学院, 中国科学院网络化控制系统重点实验室, 沈阳, 110000  

2. 中国科学院沈阳自动化研究所, 中国科学院网络化控制系统重点实验室, 沈阳, 110016

语种 中文
文献类型 研究性论文
ISSN 1002-8331
学科 自动化技术、计算机技术
基金 辽宁省科技计划项目
文献收藏号 CSCD:6056403

参考文献 共 17 共1页

1.  Xu D. A comprehensive survey of clustering algorithms. Annals of Data Science,2015,2(2):165-193 被引 19    
2.  Jain A K. Data clustering:50 years beyond K-means. Machine Learning and Knowledge Discovery in Databases,European Conference,Ecml/pkdd 2008,2008:3-4 被引 1    
3.  Rokach L. A survey of clustering algorithms. Data Mining and Knowledge Discovery Handbook,2010:269-298 被引 1    
4.  Kumar G. A survey on clustering-a data mining technique,2015 被引 1    
5.  Berkhin P. A survey of clustering data mining techniques. Grouping Multidimensional Data,2006,43(1):25-71 被引 5    
6.  王印松. 基于改进模糊聚类的控制系统故障检测. 信息与控制,2017,46(1):41-45 被引 5    
7.  Kameshwaran K. Survey on clustering techniques in data mining. International Journal of Computer Science & Information Technology,2014 被引 1    
8.  周涛. 数据挖掘中聚类算法研究进展. 计算机工程与应用,2012,48(12):100-111 被引 45    
9.  Ester M. A density-based algorithm for discovering clusters in large spatial databases with noise. Proceedings of ACM SIGKDD'96,1996:226-231 被引 3    
10.  Ankerst M. Optics:ordering points to identify the clustering structure. Proc of ACM SIGMOD 1999,1999:49-60 被引 3    
11.  Sander J. Density-based clustering in spatial databases:The algorithm gdbscan and its applications. Data Mining and Knowledge Discovery,1998,2(2):169-194 被引 80    
12.  Han Jiawei. 数据挖掘概念与技术,2012 被引 16    
13.  Rodriguez A. Clustering by fast search and find of density peaks. Science,2014,344(6191):1492-1496 被引 732    
14.  Zhang W. Extended fast search clustering algorithm:widely density clusters,no density peaks. Computer Science,2015 被引 1    
15.  谢娟英. K近邻优化的密度峰值快速搜索聚类算法. 中国科学:信息科学,2016,46(2):258-280 被引 54    
16.  Mehmood R. Fuzzy clustering by fast search and find of density peaks. Entertainment Computing-ICEC 2015,2015 被引 1    
17.  Ye Z. Density-ratio based clustering for discovering clusters with varying densities. Pattern Recognition,2016,60:983-999 被引 1    
引证文献 13

1 许朝阳 基于密度二分法的密度峰值聚类方法 计算机工程与应用,2018,54(12):138-145
被引 0 次

2 吴辰文 结合蝙蝠算法改进的密度峰值聚类算法 西北大学学报. 自然科学版,2019,49(4):597-604
被引 1

显示所有13篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

iAuthor 链接
周晓锋 0000-0001-9837-1261
版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号