当前位置:主页 > 资源下载 > 46 > 使用Pytorch中的LSTM生成风格化图像字幕的任务被称为stylized_image_captioning

使用Pytorch中的LSTM生成风格化图像字幕的任务被称为stylized_image_captioning

更新：2024-12-12 12:10:32
大小：212KB
推荐：★★★★★
来源：网友上传分享
类别：数据集 - 行业研究
格式：ZIP

反馈 / 投诉

资源介绍

实施StyleNet：使用LSTM生成样式化的图像标题战队：蔡丽莎，刘德华介绍该项目的目的是实现一种图像字幕模型，该模型具有生成风格化字幕（浪漫或有趣）的能力。我们将基于Microsoft Research Redmond的论文“ StyleNet：用样式生成有吸引力的视觉字幕”建立模型。我们的模型将以Pytorch编写。数据我们的模型使用两个数据集。第一个是具有图像和事实字幕的Flickr10k数据集，该数据集用于我们的图像字幕任务。对于我们的语言模型，我们将使用由原始论文的作者发布的FlickrStyle 7k数据集。技术概述 LSTM模型我们将从本文应用因式分解LSTM模型。对于图像字幕，文献中常用的策略是采用预先训练的CNN模型作为编码器，以将图像映射到固定尺寸的特征向量，然后使用LSTM模型作为解码器，以基于图像向量生成字幕。在这里，“分解的LSTM”

相关推荐

12-02 使用Pytorch中的LSTM生成风格化图像字幕的任务被称为stylized_image_captioning

使用Pytorch中的LSTM生成风格化图像字幕的任务被称为stylized_image_captioning

资源介绍

热门标签

资源声明