登录 注册
当前位置:主页 > 资源下载 > 9 > MATLAB代码请求:用于Python和R的Genie++,一个快速且稳健的层次聚类算法,具备噪声点检测功能,求其最小生成树实现

MATLAB代码请求:用于Python和R的Genie++,一个快速且稳健的层次聚类算法,具备噪声点检测功能,求其最小生成树实现

  • 更新:2024-06-13 22:27:20
  • 大小:20.82MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Matlab - 大数据
  • 格式:ZIP

资源介绍

求matlab代码最小生成树精灵:具有噪声点检测的快速和鲁棒的层次聚类。 Genie可以输出有意义的簇,并且即使在大型数据集上也很快。 有关文档,教程和基准的信息,请参见。 关于 Genie的更快,更强大的版本-健壮且抗异常值的聚类算法(请参阅Gagolewski,Bartoszuk和Cena,2016年),最初包含在R包中。 Genie背后的想法非常简单。 首先,使每个点成为其自身群集的唯一成员。 然后,继续合并最接近的群集对,一个接一个。 但是,为防止形成高度不平衡的群集,有时会将大小最小的点组与其最近的邻居匹配。 Genie引人入胜的简单性与其易用性息息相关。 它通常胜过其他聚类方法,例如K-means,BIRCH或average,Ward,并在上完全关联。 Genie的运行速度也非常快-可以在喝咖啡休息时间内完成数百万个数据集的整个聚类层次结构的确定。 因此,它非常适合解决适合内存的数据(也很稀疏)的极端聚类任务(具有要检测的任何数量的聚类的大型数据集)。 由于使用了nmslib,因此还支持稀疏或字符串输入。 它还可以针对相互可达距离进行聚类,因此它可以充当噪声点检测器或HDB