-
Machine-Learning-Spam-Filter MATLAB精度验证代码:应用于垃圾邮件的机器学习过滤
资源介绍
matlab精度检验代码机器学习垃圾邮件过滤器
##一些背景信息##我们将基于UCI机器学习基准数据库来实现朴素的贝叶斯分类器,以对垃圾邮件进行过滤,该数据库的名称已经为每封电子邮件提取了57个功能,所有实例均标记为“
0”(正常)或“
1”(垃圾邮件)。
此方法的目的是使用Matlab进行从模块中学习的朴素贝叶斯分类算法,以提供开发在不同情况下工作的垃圾邮件过滤器的基础技术,从而加深我们对朴素贝叶斯分类器及其在垃圾邮件中的应用的了解过滤。
为了将离散值朴素贝叶斯分类器应用于垃圾邮件过滤,通过进一步离散化连续属性值来修改垃圾邮件数据库。
另外,某些实例已被重新标记为“
2”以指示“不确定”,即新添加的类。
资料档案
我们有三个后缀为.mat的数据文件,如下所示:
av2_c2-二进制分类的数据集,其中每个属性具有两个离散值。
av3_c2-二进制分类的数据集,其中每个属性具有三个离散值。
av7_c3-三类分类的数据集,其中每个属性具有七个离散值。
####上述每个数据集都包含以下相同的数据格式:####
AttributeSet
–一个M
*
57矩阵,其中每一行代表一个训练示例的特