-
最新进展的视觉和语言预训练模型(VL-PTM):awesome-vision-language-pretraining-papers
资源介绍
视觉和语言预训练模型(VL-PTM)的最新进展
由( )维护。 2021/02/26的最新更新。
目录
基于图像的VL-PTM
表征学习
预训练不可知视觉语言表示法,NeurIPS 2019 [代码]
LXMERT:从变压器学习跨模态编码器表示法,EMNLP 2019 [代码]
VL-BERT:通用视觉语言表示的预训练,ICLR 2020 [代码]
VisualBERT:视觉和语言的简单而高性能的基准,arXiv 2019/08,ACL 2020 [代码]
Unicoder-VL:跨模式预训练的视觉和语言通用编码器,AAAI 2020
用于图像字幕和VQA的统一视觉语言预训练,AAAI 2020, [code] ,( VLP )
单元:学习通用图像文本表示形式,ECCV 2020, [代码]
弱监督有助于词对象对齐的出现并改善视觉语言任务,arXiv 2019/12
In