-
获取Java源码,用于从文本中提取weka格式的特征
资源介绍
这是本人编写的用java进行海量文本特征提取,提取出来的格式是weka数据挖掘工具能够识别的,可以用weka来进行文本的分类和聚类等一些数据挖掘方法。压缩包里面已经有了训练集和测试集这两种文档,大家可以用editplus软件打开,此程序可以针对海量文本进行分类和聚类,但必须用到weka数据挖掘工具。如有不懂的+QQ:10642346。
- 上一篇: RoleDiscovery:大规模网络中的特征提取和角色发现
- 下一篇: 特征提取后的图像分类