-
Image-captioning下载
资源介绍
图像字幕
描述
图像字幕是Encoder-Decoder体系结构中最流行的应用之一,其中RNN被用作Decoder时,CNN提取并编码图像的特征。
数据
该项目的数据集是Flickr_8k数据集。它包含8000张图像,以及每个图像包含5个标题的文本文件。
模型训练
该项目中使用的库是Tensorflow,NLTK,pandas和numpy。为了对特征图像进行编码,将Inception_V3模型与转移学习一起使用以下载权重。解码器具有双向LSTM,后跟一个LSTM层。该项目采用的方法是合并模型,其中,编码器分别从图像中提取特征,而RNN分别在字幕上进行训练,然后将这些信息连接起来并通过全连接层以进行最终预测。
部署
该应用程序使用Streamlit框架创建前端API,并部署在Heroku上。 Streamlit是一个框架,您可以使用它来创建美观的前端Webapp,而无需HTML和CSS。您可
- 上一篇: 自然语言处理
- 下一篇: 基于深度学习的智能聊天机器人的研究