-
MATLAB代码实现的生成对抗神经网络-Neuraltalk:图像转字幕算法
资源介绍
生成对抗神经网络matlab代码#NeuralTalk
警告:已弃用。
您好,这段代码现在很旧且效率低下,现在已弃用。
我将它留在
Github
上用于教育目的,但如果您想运行或训练图像字幕,我强烈推荐我的新代码版本。
NeuralTalk2
是用编写的,并且明显(我的意思是,~100
倍以上)更快,因为它是在
GPU
上进行批处理和运行的。
它还支持
CNN
微调,这对性能有很大帮助。
该项目包含Python+numpy源代码,用于学习用句子描述图像的多模态循环神经网络。
这方面的工作最近出现在
a
中,并且在过去几个月里一直是研究界多篇学术论文的主题。
此代码目前实现了
和
提出的模型。
两种模型都采用图像并使用循环神经网络(LSTM
或
RNN)预测其句子描述。
概述
该项目的管道如下所示:
输入是使用
Amazon
Mechanical
Turk
收集的图像数据集和
5
个句子描述。
特别是,此代码库是为
、
和
数据集设置的。
在训练阶段,图像作为输入提供给
RNN,并要求
RNN
预测句子中的单词,条件是当前单词和先前的上下文,由神经网络的隐藏层介导。
在这个阶段,网络的参
- 上一篇: blitz:适用于C ++的Blitz ++多维数组库
- 下一篇: 朴素贝叶斯matlab代码.zip