-
fairseq-image-captioning-master下载
资源介绍
图像字幕变压器
该项目使用基于的图像字幕模型扩展了 。 它仍在进行中,并受到以下论文的启发:
[1]
史蒂文·雷尼(Steven J. 。 2017年,计算机视觉与模式识别,第1179-1195页。
[2]
彼得·安德森(Peter Anderson),何小东,克里斯·布勒(Chris Buehler),达米安·泰尼(Damien Teney),马克·约翰逊(Mark Johnson),斯蒂芬·古尔德(Stephen Gould),张磊。 。 在IEEE计算机视觉和模式识别会议会议录中,第6077-6086页,2018年。
[3]
Ashish Vaswani,Noam Shazeer,Niki Parmar,Jakob Uszkoreit,Llion Jones,Aidan N.Gomez,ŁukaszKaiser和Illia Polosukhin。 。 《神经信息处理系统的