K-means Clustering Algorithm with Meliorated Initial Center


文摘 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心.实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性.
其他语种文摘 The traditional k-means algorithm has sensitivity to the initial start center. To solve this problem, a new method is proposed to find the initial start center. First it computes the density of the area where the data object belongs to; then finds k data objects all of which are belong to high density area and the most far away to each other, using these k data objects as the initial start centers. Experiments on the standard database UCI show that the proposed method can produce a high purity clustering result and eliminate the sensitivity to the initial start centers.
来源 计算机工程 ,2007,33(3):65-66 【核心库】
关键词 数据挖掘 ; 聚类 ; k-means算法 ; 聚类中心

河北大学数学与计算机学院, 保定, 071002

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 自动化技术、计算机技术
基金 河北省科技攻关项目 ;  河北省教育厅科学研究计划项目
文献收藏号 CSCD:2835098

引证文献 47

1 花海洋 聚类算法在银行客户细分中的应用 计算机工程,2008,34(24):37-39
CSCD被引 2

2 张永 基于数据分割和集成学习的大规模SVM分类算法 系统工程,2009,27(3):84-88
CSCD被引 0 次


