登录 注册
当前位置:主页 > 资源下载 > 9 > \"图像字幕版本1的生成对抗神经网络Matlab代码\

\"图像字幕版本1的生成对抗神经网络Matlab代码\

  • 更新:2024-07-30 10:59:08
  • 大小:54.71MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Matlab - 大数据
  • 格式:ZIP

资源介绍

生成对抗神经网络matlab代码#NeuralTalk 警告:已弃用。 您好,这段代码现在很旧且效率低下,现在已弃用。 我将它留在 Github 上用于教育目的,但如果您想运行或训练图像字幕,我强烈推荐我的新代码版本。 NeuralTalk2 是用编写的,并且明显(我的意思是,~100 倍以上)更快,因为它是在 GPU 上进行批处理和运行的。 它还支持 CNN 微调,这对性能有很大帮助。 该项目包含Python+numpy源代码,用于学习用句子描述图像的多模态循环神经网络。 这方面的工作最近出现在 a 中,并且在过去几个月里一直是研究界多篇学术论文的主题。 此代码目前实现了 和 提出的模型。 两种模型都采用图像并使用循环神经网络(LSTM 或 RNN)预测其句子描述。 概述 该项目的管道如下所示: 输入是使用 Amazon Mechanical Turk 收集的图像数据集和 5 个句子描述。 特别是,此代码库是为 、 和 数据集设置的。 在训练阶段,图像作为输入提供给 RNN,并要求 RNN 预测句子中的单词,条件是当前单词和先前的上下文,由神经网络的隐藏层介导。 在这个阶段,网络的参