-
朴素贝叶斯文本分类器(基于TFIDF):naive_bayes_classifier
资源介绍
朴素贝叶斯分类器
C++
具有 TF/IDF 平滑的基于文本的朴素贝叶斯分类器
设计决策:
我的设计如下。 首先,我为每个类别实例化了 4 个 映射,以跟踪 training.txt 中的单词和单词计数。 我还实例化了 4 个 映射,以跟踪给定每个类别的每个单词的概率。 我阅读了训练文件,在每一行上执行了一个 getline,然后处理每个单词,如果该术语不在地图中,则将其添加到各自的地图中,否则我将计数增加 1。我有一个计算总字词函数可以找到每个地图(类别)中的单词总数。 我有一个 computeProbability() 函数,它用我的算法计算概率并将其存储到概率图中。 我有一个分类(队列 q)函数,它接受一个队列并处理队列中的每个单词。 队列将单词存储在测试文件的特定行中。 然后计算该行的每个类别的概率并选择最大值并返回