-
Python 实现的 k-means 聚类算法,应用于评论数据挖掘,简称 kmeans-data-mining
资源介绍
数据挖掘 K-Means 算法
该程序实现了 K-Means 聚类算法。 该程序旨在与“/.data”目录中的“data.txt”文件一起运行。 如果要使用不同的文件名,则需要相应地更新代码。
构建和执行指令
从命令行构建和执行运行命令python kmeans.py 。
您将看到 4 个选项:
使用聚类均值作为聚类中心执行 K-Means 聚类。
使用最近的 insatnce 来执行 K-Means 聚类,以均值作为聚类中心。
对 K = 2->20 自动执行选项 1,对每个 K 值进行 5 次迭代。
对 K = 2->20 自动执行选项 2,对每个 K 值进行 5 次迭代。
注意:选项 3 和 4 只允许选项 1 或 2 的自动重复。它们执行 K 值从 2 到 20 的 K 均值聚类。对于每个 K 值,该过程重复 5 次,平均精度,召回率和 f_score 计算。 然后在