登录 注册
当前位置:主页 > 资源下载 > 49 > [python] 源码实现:结合Kmeans文本聚类算法、PAC降维技术及Matplotlib进行聚类图像可视化

[python] 源码实现:结合Kmeans文本聚类算法、PAC降维技术及Matplotlib进行聚类图像可视化

  • 更新:2024-08-06 08:39:32
  • 大小:247KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Python - 后端
  • 格式:RAR

资源介绍

该资源主要参考我的博客: [python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像 http://blog.****.net/eastmount/article/details/50545937 包括输入文档txt,共1000行数据,每行都是分词完的文本。 本文主要讲述以下几点: 1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档 M个特征词); 2.调用scikit-learn中的K-means进行文本聚类; 3.使用PAC进行降维处理,每行文本表示成两维数据; 4.最后调用Matplotlib显示聚类效果图。 免费资源,希望对你有所帮助~ By Eastmount