efficientnetv2 空洞卷积

最近我们重新设计了特征提取网络。主要原因就是化学分析这种环境里,低噪声不是问题,真正让算法头疼的是特征提取不够深入。所以我们用EfficientNetv2作为骨干网络,它通过MBConv和Fused-MBConv混合模块让计算资源用到了实处,输出不同尺度的特征图。EfficientNetv2不仅能处理高分辨率图像中的细节,还能兼顾上下文信息。 我们把空洞卷积引入这个系统,因为它能增加感受野而不增加参数。空洞卷积就像给滤波器加了个“气垫”,在权重之间插入空洞。扩张率越大,空洞越多,同样大小的卷积核就覆盖更多像素区域。例如,一个3×3的普通卷积核可以变成5×5的“虚拟大核”,感受野从3扩大到7。 相比池化操作,空洞卷积有两个明显优势:首先它不会丢掉任何信息;其次它支持多尺度特征。通过调整扩张率为[1, 6, 12],我们能得到三张不同视野的特征图。 化学分析场景中样本差异小、动作重复且背景单一,空洞卷积正好解决了这个问题。模型可以在保持轻量化的同时兼顾近处细节和远处语义信息。 我们把系统里所有普通池化层替换成了空洞卷积后进行实验发现:小目标召回率提升了12%,平均漏检数下降了40%,模型参数仅增加10%。所以说,在这个受控场景下用空洞卷积真是个高性价比的选择。