-
Compositional Learning of Image-Text: LeetCode-ComposeAE官方代码,源于WACV2021论文
资源介绍
颜色分类leetcode
用于图像检索的图像-文本查询的组合学习:WACV
2021
该文件可在以下位置访问:
。
这是
WACV
2021
论文随附的代码:用于图像检索的图像-文本查询的组合学习。
介绍
人类感知的独特特征之一是多模态。
我们无意识地将属性附加到对象上,这些属性有时可以唯一地识别它们。
例如,当一个人说苹果时,很自然地会在他们的脑海中形成一个苹果的形象,可能是绿色或红色。
在信息检索中,用户通过发送查询从检索系统中寻找信息。
传统的信息检索系统允许单模态查询,即文本或图像。
预告图
先进的信息检索系统应该允许用户通过允许多模式查询来表达他们心中的概念。
在这项工作中,我们考虑了这样一个高级检索系统,用户可以根据多模式(图像-文本)查询从数据库中检索图像。
具体来说,查询文本会提示查询图像中的一些修改,任务是检索具有所需修改的图像。
该任务在电子商务搜索、监控系统和互联网搜索领域有应用。
该图显示了该任务的一个潜在应用场景。
在该图中,电子商务平台的用户有兴趣购买一条裙子,该裙子看起来应该与她朋友的裙子相似,但裙子应该是白色的,并带有缎带腰带。
在这种情况下,我们希望算
- 上一篇: 学术海报设计速成.pdf
- 下一篇: poster 壁报 模板 PPT 国际会议