-
Apache Hadoop上的Naive Bayes项目:hadoop-naive-bayes
资源介绍
朴素贝叶斯在Hadoop上
该项目使用UCI存储库中的数据集“ Cencus Income”,其中包含有关某些人的收入预测的数据。
数据集可以从下载(特别是文件adult.data)。
项目介绍
对于此项目,我们在Hadoop上实现了一个朴素的贝叶斯分类器,并在“ Cencus Income”数据集中进行了测试。
预处理
对于数字属性,我们在Hadoop上使用MapReduce实现了离散化。