最优聚类个数和初始聚类中心点选取算法研究
Algorithm research of optimal cluster number and initial cluster center
查看参考文献13篇
文摘
|
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取原则来选取初始聚类中心点,避免初始聚类中心点集中在一个小的范围,防止陷入局部最优。实验证明,该算法能选取最优的k值,通过用标准的UCI数据库进行实验,采用的算法能选择出唯一的初始中心点,聚类准确率较高、误差平方和较小。 |
其他语种文摘
|
The cluster k of traditional K-means algorithm could not determine beforehand and the initial clustering centers of K-means algorithm were randomly selected,which might result in low accurary and unstable clustering. This paper based on the SSE for selecting the number of clusters k,based on the principle that the clustering center of the surrounding area was relatively dense,and between the clustering center distance was relatively far,selected the initial clustering center to avoid the initial clustering center focused on a small range, prevented fall into local optimum. In the case of the number of categories k was given. This paper used the standard UCI data sets for test. Tests show that, this method can select the optimal value of k,it can choose the only center of initial clustering and have the higher accuracy and the minimum errors. |
来源
|
计算机应用研究
,2017,34(6):1617-1620 【扩展库】
|
DOI
|
10.3969/j.issn.1001-3695.2017.06.004
|
关键词
|
K-means算法
;
聚类中心
;
准确率
;
误差平方和
|
地址
|
中国科学院沈阳自动化研究所, 中国科学院光电信息处理重点实验室;;辽宁省图像理解与视觉计算重点实验室, 沈阳, 110016
|
语种
|
中文 |
文献类型
|
研究性论文 |
ISSN
|
1001-3695 |
学科
|
自动化技术、计算机技术 |
文献收藏号
|
CSCD:6017038
|
参考文献 共
13
共1页
|
1.
谢娟英. 基于样本空间分布密度的初始聚类中心优化K-均值算法.
计算机应用研究,2012,29(3):888-892
|
被引
18
次
|
|
|
|
2.
秦亮. 基于免疫克隆算法的多目标聚类方法.
信息与控制,2013,42(1):8-12
|
被引
3
次
|
|
|
|
3.
张靖. 优化初始聚类中心的改进k-means算法.
计算机工程与设计,2013,34(5):1691-1694
|
被引
15
次
|
|
|
|
4.
冯波. K-means算法初始聚类中心选择的优化.
计算机工程与应用,2013,49(14):182-185
|
被引
18
次
|
|
|
|
5.
郑丹. K-means初始聚类中心的选择算法.
计算机应用,2012,32(8):2186-2188
|
被引
12
次
|
|
|
|
6.
仝雪姣. 对k-means初始聚类中心的优化.
计算机工程与设计,2011,32(8):2721-2723
|
被引
7
次
|
|
|
|
7.
熊忠阳. 一种有效的K-means聚类中心初始化方法.
计算机应用研究,2011,28(11):4188-4190
|
被引
32
次
|
|
|
|
8.
王赛芳. 基于初始聚类中心优化的K一均值算法.
计算机工程与科学,2010,32(10):105-107
|
被引
5
次
|
|
|
|
9.
苏锦旗. 基于划分的K-均值初始聚类中心优化算法.
微电子学与计算机,2009,26(1):8-11
|
被引
11
次
|
|
|
|
10.
Frank A.
UCI machine learning repository,2010
|
被引
84
次
|
|
|
|
11.
韩凌波. 一种改进的k-means初始聚类中心选取算法.
计算机工程与应用,2010,46(17):150-152
|
被引
29
次
|
|
|
|
12.
汪中. 一种优化初始中心点的K-means算法.
模式识别与人工智能,2009,22(2):299-304
|
被引
64
次
|
|
|
|
13.
袁方. 初始聚类中心优化的k-means算法.
计算机工程,2007,33(3):65-66
|
被引
47
次
|
|
|
|
|