基于单目的轻量化目标识别系统设计
CSTR:
作者:
作者单位:

(1.上海交通大学 微米/纳米加工技术国家级重点实验室, 上海 200240;2.上海交通大学 电子信息与电气工程学院 微纳电子学系, 上海 200240)

作者简介:

舒 童(1996-),男,山东人,硕士研究生,主要研究方向为图像识别以及飞行器控制;

通讯作者:

中图分类号:

基金项目:

教育部基金项目(6141A02022607,6141A02022627);上海市科委项目(19511104202,19DZ2291103);预研基金项目(1816311ZT005020,301020803,17070107).*通信作者:张卫平E-mail:zwp37@163.com


Lightweight Design of Target Recognition System Based on Monocular Vision
Author:
Affiliation:

(1. National Key Laboratory of Science and Technology on Micro/Nano Fabrication;2. Department of Micro/Nano Electronics, Shanghai Jiaotong University, Shanghai 200240, CHN)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为了满足微型无人飞行器实时控制的要求,文章对Yolo-V4单阶段图像检测算法进行了轻量化设计,并基于单目摄像头设计了实时目标识别系统。该轻量化算法首先通过优化输入网络的分辨率和卷积层参数等方法,将主干网络由73层压缩到16层;然后通过简化残差结构和跨级结构,解决深层网络梯度消失问题,减少梯度信息重复;最后自下而上将网络浅层和深层特征进行了精简融合。采用K均值聚类算法训练轻量化模型以优化预选框参数,提高算法对特定目标的检测精度。测试表明,改进后的轻量化算法对特定目标的预测精度为98%,召回率为92%,均值平均精度达90.70%,单张图片检测时间为7.8ms,对视频的处理速度可达125.6f/s,满足微型无人飞行器的实时应用要求。

    Abstract:

    To meet the requirement of real-time control of micro-unmanned aerial vehicles, a light-weighted Yolo-V4 single-stage image detection algorithm was designed, and a real-time target recognition system was designed based on a monocular camera. The light-weighted algorithm compresses the backbone network from 73 layers to 16 layers by improving the resolution of the input network and the parameters of the convolutional layer. And then by simplifying the residual and cross-level structures, the problem of deep network gradient disappearance was revolved, and the gradient information duplication was reducing. Finally, the shallow and deep features of the network were streamlined and merged from bottom to top. The K-means clustering algorithm was used to train the light-weighted model to improve the parameters of the pre-selection box and improve the detection accuracy of the algorithm for specific targets. Test results show that the proposed algorithm can reach a prediction accuracy of 98% for a specific target, a recall rate of 92%, a mean average accuracy of 90.70%, a single image detection time of 7.8ms, and a video processing speed of 125.6f/s, which can meet the real-time application requirements of micro unmanned aerial vehicles.

    参考文献
    相似文献
    引证文献
引用本文
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-11-26
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2021-04-30
  • 出版日期:
文章二维码

漂浮通知

①《半导体光电》新近入编《中文核心期刊要目总览》2023年版(即第10版),这是本刊自1992年以来连续第10次被《中文核心期刊要目总览》收录。
②目前,《半导体光电》已入编四个最新版高质量科技期刊分级目录,它们分别是中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》(T3)、中国图象图形学学会《图像图形领域高质量科技期刊分级目录》(T3)、中国电工技术学会《电气工程领域高质量科技期刊分级目录》(T3)和中国照明学会《照明领域高质量科技期刊分级目录》(T2)。
③关于用户登录弱密码必须强制调整的说明
④《半导体光电》微信公众号“半导体光电期刊”已开通,欢迎关注