改进的k-平均聚类算法研究
Research on Modified k-means Data Cluster Algorithm
查看参考文献15篇
文摘
|
聚类算法的好坏直接影响聚类的效果.该文讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种基于加权改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度.实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果. |
其他语种文摘
|
The method of data clustering will influence the effect of clustering directly. The algorithm of k-means is discussed, the shortages of this algorithm such as it can not deal with symbolic data and it is sensitive for data of isolation point and noise are demonstrated. A modified k-means clustering algorithm based on weights is put forward, it changes the shortcomings of k-means. Its complexity is analyzed from theoretical. The experiments show that, compared with traditional method based on means, the modified data clustering algorithm can improve the efficiency of data clustering. |
来源
|
计算机工程
,2007,33(13):200-201,209 【核心库】
|
关键词
|
聚类算法
;
k-平均
;
权
;
聚类数据挖掘
|
地址
|
西南交通大学智能控制开发中心, 成都, 610031
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1000-3428 |
学科
|
自动化技术、计算机技术 |
基金
|
国家自然科学基金
|
文献收藏号
|
CSCD:2843683
|
参考文献 共
15
共1页
|
1.
史忠植. 知识发现[M].
知识发现,2002
|
CSCD被引
319
次
|
|
|
|
2.
Han Jiawei. Concepts and Techniques[M].
Data Mining:Concepts and Techniques,2000
|
CSCD被引
70
次
|
|
|
|
3.
Grabmeier J. Techniques of Cluster Algorithms in Data Mining[J].
Data Mining and Knowledge Discovery,2002,6(4):303
|
CSCD被引
28
次
|
|
|
|
4.
Jain A K. A Review[J].
ACM Computing Surveys,1999,31(3):264-323
|
CSCD被引
355
次
|
|
|
|
5.
MacQueen J. Some Methods for Classification and Analysis of Multivariate Observations[C]//Proc.
Proc.of the 5th Berkeley Symp.on Math.Statist,1967:281-297
|
CSCD被引
2
次
|
|
|
|
6.
Kaufman J. An Introduction to Cluster Analysis[M].
Finding Groups in Data:An Introduction to Cluster Analysis,1990
|
CSCD被引
2
次
|
|
|
|
7.
Ester M. A Density-based Algorithm for Discovering Clusters in Large Spatial Databases[C]//Proc.
Proc.of 1996 Intl.Conf.on Knowledge Discovery and Data Mining,1996:226-231
|
CSCD被引
1
次
|
|
|
|
8.
Ankerst M. Ordering Points to Identify the Clustering Structure[C]//Proc.
Proc.of 1999 ACM-SIGMOD Intl.Conf.on Management of Data,1999:49
|
CSCD被引
1
次
|
|
|
|
9.
Wang W. A Statistical Information Grid Approach to Spatial Data Mining[C]//Proc.
Proc.of 1997 Intl.Conf.on Very Large Databases,1997:186-195
|
CSCD被引
1
次
|
|
|
|
10.
Kohonen T. Self-organized Formation of Topologically Correct Feature Maps[J].
Biological Cybernetics,1982,43(1):59-69
|
CSCD被引
209
次
|
|
|
|
11.
Arning A. A Linear Method for Deviation Detection in Large Databases[C]//Proc.
Proc.of 1996 Intl.Conf.on Data Mining and Knowledge Discovery,1996:164-169
|
CSCD被引
1
次
|
|
|
|
12.
Sarawagi S. Discovery-driven Exploration of OLAP Data Cubes[C]//Proc.
Proc.of Intl.Conf.on Extending Database Technology,1998:168-182
|
CSCD被引
1
次
|
|
|
|
13.
余建桥. 基于数据场改进的PAM聚类算法.
计算机科学,2005,32(1):165-167
|
CSCD被引
4
次
|
|
|
|
14.
刘少辉. 一种基于Rough集的层次聚类算法.
计算机研究与发展,2004,41(4):552-557
|
CSCD被引
10
次
|
|
|
|
15.
Hettich S. UCI Repository of Machine Learning Databases[Z].
http://www.ics.1 uci.edu/~mlearn/MLRepository.html,1998
|
CSCD被引
1
次
|
|
|
|
|