资源介绍
kmeans算法代码
Kmeans算法基本思想是:首先给出聚类的个数K,然后初始随机给定K个待聚类中心(也叫簇中心),按照最邻近原则把待分类样本点分到各个类,也就是样本点到哪个簇中心的距离最近,这个样本点就属于哪一类。然后按平均法重新计算各个簇的质心,从而确定新的簇心,即新的簇中心坐标是这一类中所有数据点坐标的算术平均值,如此一直迭代,直到相邻两次迭代中簇心的移动距离小于某个给定的阈值P或是迭代次数达到预选设定的上限T。
K-Means聚类算法主要分为三个步骤:
(1)输入待分类的样本数据点集D以及聚类个数K,随机产生K个数据点坐标作为这K个簇中心的初始坐标,也可以在待分类的样本点中随机选取K个点作为初始的簇中心。同时输入的还有阈值P以及上限T
(2)第二步是计算每个点到聚类中心的距离,将每个点聚类到离该点最近的聚类中去
(3)第三步是计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心
反复执行(2)、(3),直到相邻两次迭代中簇心的移动距离小于某个给定的阈值P或是迭代次数达到预选设定的上限T。为止