当前位置:主页
> 资源下载 > 9 > 使用在MS COCO数据集上训练的CNN-RNN模型,为Microsoft Common Objects生成图像标题的任务被称为image_captioning
-
使用在MS COCO数据集上训练的CNN-RNN模型,为Microsoft Common Objects生成图像标题的任务被称为image_captioning
资源介绍
图片字幕
介绍
建立一个模型以从图像生成字幕。 给定图像后,模型可以用英语描述图像中的内容。 为了实现这一点,我们的模型由一个编码器(一个CNN)和一个解码器(一个RNN)组成。 为CNN编码器提供了用于分类任务的图像,其输出被馈送到RNN解码器,后者输出英语句子。
该模型及其超参数的调整基于论文和。
我们使用微软Çommon在CO NTEXT(MS COCO)O bjects为这个项目。 它是用于场景理解的大规模数据集。 该数据集通常用于训练和基准化对象检测,分段和字幕算法。 有关下载数据的说明,请参见下面的“数据”部分。
代码
该代码可以分为两类:
笔记本-该项目的主要代码由一系列Jupyter笔记本构成:
0_Dataset.ipynb介绍数据集并绘制一些样本图像。
1_Preliminaries.ipynb加载和预处理数据并使用模型进行实验。
2_Training.ip
- 上一篇: 聚类分析中的高维数据降维方法研究
- 下一篇: 数模专题之高维统计降维附程序和数据