-
在“Replicated softmax”论文中进行的Replicated-Softmax-Model重复实验
资源介绍
复制的Softmax模型
在论文“复制的softmax:无向主题模型”中重复实验。
Preprocess.py:在此库中,您可以读取文件并删除停用词,标点符号和词干标记。 然后获得最多K个频繁令牌。 并计算字典,语料库,doc-word矩阵以及tfidf权重。
rsm_numpy.py这是RSM工作原理的详细信息,其中包括CD-x。
ppl.py这是为了计算RSM中的隐藏矢量和RSM模型的困惑度。
analysis.py在此函数中,包括余弦,精度和查全率函数。
dsl.py这是保存和加载数据的方法。
RSM_train_test.py:这是显示如何训练RSM模型,然后测试其困惑性的示例。
RSM_Experiment.py:其中有两个实验。 (1)比较LDA和RSM的困惑(2)比较LDA,RSM和TF-IDF的精度和召回率。