面向无人机航拍图像的多尺度目标检测研究
CSTR:
作者:
作者单位:

(沈阳航空航天大学 电子信息工程学院, 沈阳 110136)

作者简介:

贾 亮(1971-),男,辽宁省大石桥市人,副教授,硕士生导师,主要从事信息获取与处理方面的研究;

通讯作者:

中图分类号:

TP391

基金项目:

国家自然科学基金项目(61671310);航空科学基金项目(2019ZC054004).*通信作者:林铭文


Multiscale Target Detection for UAV Aerial Images
Author:
Affiliation:

(College of Electronic Information Engineering, Shenyang Aerospace University, Shenyang 110136, CHN)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对无人机航拍图像背景复杂、小目标占比高且分布不均导致的现有算法精度不佳等问题,提出了一种面向无人机航拍图像的多尺度目标检测网络VTO-YOLOv8。首先,采用WIoU v3作为边界框回归损失函数,并使用明智的梯度分配策略,这一策略将使网络更加关注普通质量样本,从而提高其定位能力;其次,设计四层T-BiFPN结构,加强浅层特征和深层特征的融合;此外,设计C2f-DBB多分支模块,在不增加计算量的前提下,提升检测性能;同时,使用聚焦调制模块,加强不同尺度信息的交互。实验结果表明,网络在Visdrone2019数据集上相较基准模型在mAP50和mAP指标上分别提高了9.0%和5.9%,同时参数降低了22.6%,可更好地应用于无人机航拍目标检测中。

    Abstract:

    A multiscale target detection network, VTO-YOLOv8, for unmanned aerial vehicle (UAV) images is proposed to address the low accuracy of existing algorithms caused by complex backgrounds, a high proportion of small targets, and uneven distributions. First, wise intersection over union (WIoU) v3 was used as the bounding-box regression loss, and a wise gradient allocation strategy was employed for the network to focus more on regular quality samples and improve localization ability. Second, a four-layer target bi-directional feature pyramid network (T-BiFPN) structure was designed to strengthen the integration of shallow and deep features. Furthermore, a faster implementation of CSP bottleneck with diverse branch blocks (C2f-DBB) module was designed to improve the detection performance of the network without increasing computational complexity. In addition, a focal modulation module was used to enhance the interaction of information at different scales. The experimental results demonstrated that the proposed network improved the mean average precision (mAP) and mAP50 by 5.9% and 9.0%, respectively, compared with those of the baseline network on the Visdrone2019 dataset. Moreover, the network parameters were reduced by 22.6%. The proposed method can be applied to target detection in UAV aerial photography.

    参考文献
    相似文献
    引证文献
引用本文

贾亮,林铭文,戚丽瑾,谈瑾.面向无人机航拍图像的多尺度目标检测研究[J].半导体光电,2024,45(3):501-507, 514. JIA Liang, LIN Mingwen, QI Lijin, TAN Jin. Multiscale Target Detection for UAV Aerial Images[J].,2024,45(3):501-507, 514.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-01-09
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-07-11
  • 出版日期:
文章二维码

漂浮通知

①《半导体光电》新近入编《中文核心期刊要目总览》2023年版(即第10版),这是本刊自1992年以来连续第10次被《中文核心期刊要目总览》收录。
②目前,《半导体光电》已入编四个最新版高质量科技期刊分级目录,它们分别是中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》(T3)、中国图象图形学学会《图像图形领域高质量科技期刊分级目录》(T3)、中国电工技术学会《电气工程领域高质量科技期刊分级目录》(T3)和中国照明学会《照明领域高质量科技期刊分级目录》(T2)。
③关于用户登录弱密码必须强制调整的说明
④《半导体光电》微信公众号“半导体光电期刊”已开通,欢迎关注