登录 注册
当前位置:主页 > 资源下载 > 33 > CS205_final_project中运用了OpenMP、MPI和CUDA实现并行集群的k-means聚类算法及其matlab代码

CS205_final_project中运用了OpenMP、MPI和CUDA实现并行集群的k-means聚类算法及其matlab代码

  • 更新:2024-08-22 18:11:50
  • 大小:54.51MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Matlab - 大数据
  • 格式:ZIP

资源介绍

k-means聚类算法及matlab代码目录 介绍 K-均值聚类是一种简单且可扩展的聚类方法,它以一种客观的方式将观察结果划分为k个聚类。 它具有非常广泛的应用,例如图像分割,零售产品分类(Kusrini,2015),温室气体排放等环境问题(Kijewska和Bluszcz,2015)。 K均值聚类可以与其他高级方法结合使用。 例如,它与支持向量机(SVM)一起使用来执行自动文本分类(Perrone和Connell,2000年)。 它也可以用作预处理方法,例如在隐马尔可夫模型(HMM)中初始化(Hu和Zanibbi,2011年)。 它的广泛应用和简单的计算复杂度使k-means聚类成为当今流行的方法之一。 当维数d> 1且簇数k> 1时,找到k均值成本函数的最小值是一个NP难题。 科学家想出了几种启发式方法来找到局部最小值,但是该过程仍然需要大量计算,尤其是对于具有高维特征的大型数据集而言。 因此,我们希望在机器集群上实现k-means启发式方法的并行版本,以在不牺牲算法准确性的情况下显着加快算法的运行速度。 k均值聚类的典型方法是期望最大化(EM)。 E步将点分配到最近的聚类中心,而