-
朴素贝叶斯文本分类器在 Apache Hadoop MapReduce 中实现,命名为 crystalball.
资源介绍
CrystalBall - Apache Hadoop MapReduce 中的朴素贝叶斯文本分类器
创建者:徐敏
日期:2015年6月1日
如何使用该程序
构建程序
./build.sh
将在bin/创建一个 jar 文件 crystal.jar。
使用MapReduce建立分类模型
./mapreduce.sh
或者手动指定训练数据和输出目录:
hadoop jar bin/crystal.jar \
org.xukmin.crystal.PostMapReduce \