资源介绍
比斯图毕业项目
Src
Preprocessing.py:rawData => data.csv
train.py:加载data.csv tarin双项主题模型并将其存储为* .npy
预报.py:testSentence => P(topic | testSentence)
fermat.py:
1.P(topic | trainSentences)=>构建hnsw索引2.P(topic | testSentence)=> topK类似trainSentence
main.py:所有步骤
文件夹
双项
该模型在短文本分类中是准确的。 它为整个语料库中的单词共现模式进行了显式建模,以解决文档级单词共现稀疏的问题。 (用python实现)
hnswlib
快速近似最近邻居搜索(python出价)
竞标信息
原始出价数据
保存
将P(z | d),wz,theta存储为.npy将