1.【导读】

在这里插入图片描述

论文基本信息

信息类型 详情
论文标题 LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection
作者 Wei Lu, Si-Bao Chen, Hui-Dong Li, Qing-Ling Shu, Chris H. Q. Ding, Jin Tang, Bin Luo
作者单位 1Anhui University, 2The Chinese University of Hong Kong (Shenzhen)
论文链接 [2503.14012] LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection

引言

遥感目标检测在智慧城市、灾害监测等领域应用广泛,但航拍和卫星图像存在低分辨率、传感器噪声、运动模糊等退化问题,导致目标特征失真、结构信息丢失,且轻量级模型难以兼顾效率与性能。现有方法在多尺度和方向感知检测上有进展,但缺乏对底层图像退化机制的建模。为此,论文提出LEGNet,将Scharr边缘检测与高斯滤波融入深度学习,通过EGA模块增强特征,在五大数据集上刷新SOTA,为低质量视觉任务提供新思路,推动遥感检测在边缘设备的实时应用。

➔➔➔➔点击查看原文,获取更多即插即用模块合集
在这里插入图片描述

2.【摘要】

本文介绍了一种名为LEGNet(Lightweight Edge-Gaussian Driven Network)的轻量级骨干网络,专门用于低质量遥感图像中的目标检测任务。遥感目标检测(RSOD)常常受到低空间分辨率、传感器噪声、运动模糊和光照不良等因素的干扰,导致特征区分度降低,目标表示模糊,前景与背景难以分离。现有的RSOD方法在低质量目标的鲁棒检测方面存在局限性。LEGNet的核心是Edge-Gaussian Aggregation(EGA)模块,它通过以下两种方式增强低质量遥感图像的特征表示:(a)使用方向感知的Scharr滤波器锐化边缘细节,这些细节通常在低对比度或模糊目标中丢失;(b)基于高斯先验的特征细化,用于抑制噪声并正则化模糊的特征响应,增强在恶劣条件下的前景显著性。EGA模块有效解决了低质量图像中常见的对比度降低、结构不连续和特征响应模糊等问题,在保持计算效率的同时提高了模型的鲁棒性。在五个基准数据集(DOTA-v1.0、v1.5、DIOR-R、FAIR1M-v1.0和VisDrone2019)上的综合评估表明,LEGNet在检测低质量目标方面达到了最先进的性能。

3.【创新点】

  1. 提出EGA模块:该模块结合了传统图像处理操作(方向感知的Scharr边缘增强和基于高斯先验的特征建模)与可学习的深度特征,专门解决低质量遥感图像中的特征退化问题。
  2. 设计轻量级网络LEGNet:基于EGA模块构建的轻量级网络,能够在保持计算效率的同时,有效提高低质量目标的检测性能,特别适合在资源受限的平台上部署(如无人机和卫星)。
  3. 在多个基准数据集上取得SOTA性能:通过在五个具有挑战性的RSOD基准数据集上的广泛实验,验证了LEGNet在检测低质量目标方面的卓越性能,尤其是在小目标、模糊目标和遮挡目标的检测上表现出色。
  4. 结合传统与现代技术:LEGNet将传统的图像处理技术(如边缘检测和高斯滤波)与现代深度学习方法相结合,为从退化视觉数据中提取鲁棒特征提供了一个概念上合理且有效的框架。

4.【研究方法】

4.1 LEGNet 整体架构

在这里插入图片描述

LEGNet 采用四阶段多尺度特征提取设计,下采样率分别为 1/4、1/8、1/16 和 1/32,包含三大核心组件:

  • LoG-Stem 层:通过 7×7 高斯拉普拉斯(LoG)滤波器进行初始降采样,同时抑制噪声并增强边缘特征(图 2 (a) 左侧)。输入图像经 LoG 滤波后,通过残差连接与卷积层组合,生成 1/4 尺度特征图 F LoG-Stem F_{\text{LoG-Stem}} FLoG-Stem

  • DRFD 模块:用于 Stage 2-4 的跨阶段降采样,结合卷积与最大池化,保留小目标细节(图 2 (a) 中 Downsampling 模块)。

  • LEG 块:核心特征增强单元,分阶段应用边缘提取(Stage 1)或高斯建模(Stage 2-4),通过 EGA 模块实现特征优化(图 2 (b)-(d))。

2. EGA 模块与 LEG 块设计
  • Edge Extraction(Stage 1):使用 Scharr 算子( S x S_x Sx S y S_y Sy核)提取方向感知边缘,公式为:

A edge = ( C o n v 2 D S x ( F in ) ) 2 + ( C o n v 2 D S y ( F in ) ) 2 A_{\text{edge}} = \sqrt{(Conv_{2D}^{S_x}(F_{\text{in}}))^2 + (Conv_{2D}^{S_y}(F_{\text{in}}))^2} Aedge=(Conv2DSx(Fin))2+(Conv2DSy(Fin))2

解决低质量图像中边缘模糊问题(图 2 (d) 左分支)。

  • Gaussian Modeling(Stage 2-4):采用 5×5 高斯核(σ=1.0)平滑特征,抑制噪声并突出目标分布,公式为:

    A gauss = G 1.0 5 A ~ 5 ( F in ) A_{\text{gauss}} = G_{1.0}^{5Ã5}(F_{\text{in}}) Agauss=G1.05A~5(Fin)

增强复杂光照或遮挡下的特征显著性.

  • 特征融合机制:通过残差连接与通道注意力(ECA 策略)融合增强后的特征,提升关键信息权重(图 2 ©)。
3. 架构配置细节

在这里插入图片描述

LEGNet 分为 Tiny 和 Small 两种配置,各阶段通道数与块重复次数如下:

  • Stage 1:LoG-Stem 层将输入通道从 3 扩展至 32(Tiny)或 64(Small),接 1 个 LEG 块;

  • Stage 2-4:通过 DRFD 模块逐步扩展通道至 64/128/256(Tiny)或 128/256/512(Small),分别接 4、4、2 个 LEG 块,实现多尺度特征提取。

5.【实验结果】

5.1 定量性能:多数据集 SOTA 结果
  • DOTA-v1.0(表 1)

    LEGNet-S 在 O-RCNN 框架下实现 80.03% mAP,超越 PKINet-S(78.39%)和 LSKNet-S(77.49%),且参数更少(29.8M vs. 30.8M/31.0M)。在小车辆(SV, 81.34% AP)、游泳池(SP, 82.00% AP)等难检类别中优势显著。

在这里插入图片描述

  • DOTA-v1.5(表 4)
    mAP 达 72.89%,较 PKINet-S(71.47%)提升 1.42%,在大型车辆(LV, 82.16% AP)、集装箱起重机(CC, 43.75% AP)等新增类别中表现突出。

在这里插入图片描述

  • FAIR1M-v1.0(表 5)
    mAP 48.35%,刷新 LSKNet-S 的 47.87%,较 O-RCNN 基线提升 2.75%,验证对细粒度目标的检测能力。

在这里插入图片描述

  • DIOR-R(表 6)
    以 29.9M 参数实现 68.40% mAP,较 PKINet-S(67.03%)提升 1.37%,计算效率(118.1G FLOPs)优于同类方法。

  • VisDrone2019(表 7)
    AP 32.2%,小目标 APs 达 24.5%,较 BAFNet 提升 2.1%,适用于无人机场景下的密集小目标检测。

在这里插入图片描述

5.2 效率对比:参数与推理速度

LEGNet-T 以 3.6M 参数、30.2G FLOPs 实现 78.96% mAP,较 DecoupleNet-D2 参数减少 41.9%,mAP 提升 0.92%;LEGNet-S 推理速度 20.9 FPS,是 ARC-R50(11.8 FPS)的 1.77 倍,平衡精度与效率。

在这里插入图片描述

5.3 可视化验证:低质量目标检测优势(图 1、图 3-8)

在这里插入图片描述

  • LEGNet 在遮挡(树木遮挡车辆)和低光(建筑阴影)场景中准确检测目标,而 ResNet-50、PKINet-S 等出现漏检或误判。

  • LEGNet 对模糊船舶、小型车辆的检测精度显著高于基线方法,例如图 3 中 LEGNet 正确识别被误判为 “岸边物体” 的船舶,而其他方法漏检或错分类。

5.4 消融实验:模块有效性验证

在这里插入图片描述

  • LoG-Stem 与 EGA 模块:单独使用 LoG-Stem 或 EGA 分别提升 mAP 至 71.2% 和 71.5%,组合使用时 LEGNet-T 达 72.2%,直升机(HC)检测 AP 从 46.0% 提升至 58.3%,验证双模块互补性。

6. 【总结】

LEGNet通过结合传统图像处理和深度学习技术,为低质量遥感图像中的目标检测提供了一种有效的解决方案。它在多个基准数据集上取得了最先进的性能,同时保持了轻量级的模型设计。未来的工作可以进一步优化LEGNet的效率,并将其应用于更广泛的视觉任务中。

➔➔➔➔点击查看原文,获取更多即插即用模块合集
在这里插入图片描述

Logo

电影级数字人,免显卡端渲染SDK,十行代码即可调用,工业级demo免费开源下载!

更多推荐