神经网络中的注意力机制(Attention Mechanism)是在计算能力有限的情况下,将计算资源分配给更重要的任务,同时解决信息超载问题的一种资源分配方案。在神经网络学习中,一般而言模型的参数越多则模型的表达能力越强,模型所存储的信息量也越大,但这会带来信息过载的问题。那么通过引入注意力机制,在众多的输入信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注度,甚至过滤掉无关信息,就可以解决信息过载问题,并提高任务处理的效率和准确性。
这就类似于人类的视觉注意力机制,通过扫描全局图像,获取需要重点关注的目标区域,而后对这一区域投入更多的注意力资源,获取更多与目标有关的细节信息,而忽视其他无关信息。通过这种机制可以利用有限的注意力资源从大量信息中快速筛选出高价值的信息。
Efficient Channel Attention Module 简称 ECA,2020年 Qilong Wang等人提出的一种 高效通道注意力(ECA)模块 ;
提出了一种 不降维的局部跨通道交互策略 ,有效避免了降维对于通道注意力学习效果的影响 ;
该模块只涉及少数几个 参数,但具有明显的 效果增益 ;
适当的 跨通道交互 可以在保持 性能 的同时 显著降低模型的复杂性 ;
深度卷积神经网络(CNN)在计算机视觉领域得到了广泛的应用,在图像分类、目标检测和语义分割等方面取得了巨大的进展。从具有开创性的AlexNet提出以来,研究人员不断的探索如何才能提升CNN的性能。近年来,SENet将信息通道注意力引入卷积块引起了人们的极大兴趣,显示出极大的性能改进潜力。后来的学者将研究重点着重于如何通过捕获更复杂的通道依赖性或