-
这个存储库包含了DualAttentionNetwork (DAN) 的TensorFlow实现及其在CVPR 2017论文中的模型
资源介绍
双重关注网络
该存储库包含此CVPR 2017论文的代码(使用Tensorflow)和模型(图像到文本和文本到图像任务):
Hyeonseob Nam, Jung-Woo Ha, and Jeonghee Kim.
"Dual attention networks for multimodal reasoning and matching."
in Proc. CVPR 2017
多亏了作者(Hyeonseob Nam)的指示,我才能够复制Flickr30k上论文中报道的数字:
图片到文字
文字到图片
方法
R @ 1
R @ 5
R @ 10
先生
R @ 1
R @ 5
R @ 10
先生
丹纸
55.0
81.8
89.0
1个
39.4
69.2
79.1
2个
此实施
54.4
82.4
89.9
1.0
39.8
71.4
80.9