-
PyTorch实战注意力机制:Attention
资源介绍
Attention分享
周知瑞@研发中心, Jun 20, 2018
(一)深度学习中的直觉
3 X 1 and 1 X 3 代替 3 X 3
LSTM中的门设计
生成对抗网络
Attention机制的本质来自于人类视觉注意力机制。人们视觉在感知东西的时候一般不会是一个场景从到头看到尾每次全部都看,而往往是根据需求观察注意特定的一部分。而且当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。:
将更多的注意力聚焦到有用的部分,Attention的本质就是加权。但值得注意的是,同一张图片,人在做不同任务的时候,注意力的权重分布应该是不同的。
基于以上的直觉,Attention可以用于:
学习权重分布:
这个加权可以是保留所有分量均做加权(即soft attention);也可以是在分布中以某种采样策略选取部分分量(即hard att