帮助 关于我们

返回检索结果

改进的k-平均聚类算法研究
Research on Modified k-means Data Cluster Algorithm

查看参考文献15篇

文摘 聚类算法的好坏直接影响聚类的效果.该文讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种基于加权改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度.实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果.
其他语种文摘 The method of data clustering will influence the effect of clustering directly. The algorithm of k-means is discussed, the shortages of this algorithm such as it can not deal with symbolic data and it is sensitive for data of isolation point and noise are demonstrated. A modified k-means clustering algorithm based on weights is put forward, it changes the shortcomings of k-means. Its complexity is analyzed from theoretical. The experiments show that, compared with traditional method based on means, the modified data clustering algorithm can improve the efficiency of data clustering.
来源 计算机工程 ,2007,33(13):200-201,209 【核心库】
关键词 聚类算法 ; k-平均 ; ; 聚类数据挖掘
地址

西南交通大学智能控制开发中心, 成都, 610031

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 自动化技术、计算机技术
基金 国家自然科学基金资助项目
文献收藏号 CSCD:2843683

参考文献 共 15 共1页

1.  史忠植. 知识发现[M]. 知识发现,2002 被引 319    
2.  Han Jiawei. Concepts and Techniques[M]. Data Mining:Concepts and Techniques,2000 被引 68    
3.  Grabmeier J. Techniques of Cluster Algorithms in Data Mining[J]. Data Mining and Knowledge Discovery,2002,6(4):303 被引 28    
4.  Jain A K. A Review[J]. ACM Computing Surveys,1999,31(3):264-323 被引 346    
5.  MacQueen J. Some Methods for Classification and Analysis of Multivariate Observations[C]//Proc. Proc.of the 5th Berkeley Symp.on Math.Statist,1967:281-297 被引 2    
6.  Kaufman J. An Introduction to Cluster Analysis[M]. Finding Groups in Data:An Introduction to Cluster Analysis,1990 被引 2    
7.  Ester M. A Density-based Algorithm for Discovering Clusters in Large Spatial Databases[C]//Proc. Proc.of 1996 Intl.Conf.on Knowledge Discovery and Data Mining,1996:226-231 被引 1    
8.  Ankerst M. Ordering Points to Identify the Clustering Structure[C]//Proc. Proc.of 1999 ACM-SIGMOD Intl.Conf.on Management of Data,1999:49 被引 1    
9.  Wang W. A Statistical Information Grid Approach to Spatial Data Mining[C]//Proc. Proc.of 1997 Intl.Conf.on Very Large Databases,1997:186-195 被引 1    
10.  Kohonen T. Self-organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982,43(1):59-69 被引 193    
11.  Arning A. A Linear Method for Deviation Detection in Large Databases[C]//Proc. Proc.of 1996 Intl.Conf.on Data Mining and Knowledge Discovery,1996:164-169 被引 1    
12.  Sarawagi S. Discovery-driven Exploration of OLAP Data Cubes[C]//Proc. Proc.of Intl.Conf.on Extending Database Technology,1998:168-182 被引 1    
13.  余建桥. 基于数据场改进的PAM聚类算法. 计算机科学,2005,32(1):165-167 被引 4    
14.  刘少辉. 一种基于Rough集的层次聚类算法. 计算机研究与发展,2004,41(4):552-557 被引 10    
15.  Hettich S. UCI Repository of Machine Learning Databases[Z]. http://www.ics.1 uci.edu/~mlearn/MLRepository.html,1998 被引 1    
引证文献 9

1 孙秀娟 基于新聚类有效性函数的改进K-means算法 计算机应用,2008,28(12):3244-3247
被引 0 次

2 曹亮 基于观测数据偏差修正的DBSCAN改进算法 计算机工程与设计,2009,30(13):3160-3162
被引 0 次

显示所有9篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号