登录 注册
当前位置:主页 > 资源下载 > 9 > 使用在MS COCO数据集上训练的CNN-RNN模型,为Microsoft Common Objects生成图像标题的任务被称为image_captioning

使用在MS COCO数据集上训练的CNN-RNN模型,为Microsoft Common Objects生成图像标题的任务被称为image_captioning

  • 更新:2024-07-30 08:31:50
  • 大小:2.09MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据集 - 行业研究
  • 格式:ZIP

资源介绍

图片字幕 介绍 建立一个模型以从图像生成字幕。 给定图像后,模型可以用英语描述图像中的内容。 为了实现这一点,我们的模型由一个编码器(一个CNN)和一个解码器(一个RNN)组成。 为CNN编码器提供了用于分类任务的图像,其输出被馈送到RNN解码器,后者输出英语句子。 该模型及其超参数的调整基于论文和。 我们使用微软Çommon在CO NTEXT(MS COCO)O bjects为这个项目。 它是用于场景理解的大规模数据集。 该数据集通常用于训练和基准化对象检测,分段和字幕算法。 有关下载数据的说明,请参见下面的“数据”部分。 代码 该代码可以分为两类: 笔记本-该项目的主要代码由一系列Jupyter笔记本构成: 0_Dataset.ipynb介绍数据集并绘制一些样本图像。 1_Preliminaries.ipynb加载和预处理数据并使用模型进行实验。 2_Training.ip