-
基于配对约束的SubKMeans算法用于确定聚类数
资源介绍
随着数据维度的增加, 传统聚类算法会出现聚类性能差的现象. SubKMeans是一种功能强大的子空间聚类算法, 旨在为K-Means类算法搜索出一个最佳子空间, 降低高维度影响, 但是该算法需要用户事先指定聚类数目K值, 而在实际使用中有时无法给出准确的K值. 针对这一问题, 引入成对约束, 将成对约束与轮廓系数进行结合, 提出了一种基于成对约束的SubKMeans聚类数确定算法. 改进后的轮廓系数能够更加准确的评价聚类性能, 从而实现K值确定, 实验结果证明该方法的有效性.