基于Zynq平台的低功耗人脸检测加速系统
CSTR:
作者:
作者单位:

(1. 福州大学 物理与信息工程学院, 福州 350116;2. 中国福建光电信息科学与技术创新实验室, 福州 350116;3. 福州大学 先进制造学院, 福建 泉州 362200)

作者简介:

赵 民(1998-),男,硕士研究生,主要研究方向:现代光电系统;

通讯作者:

中图分类号:

TP391

基金项目:

国家重点研发计划项目(2021YFB3600603);福建省自然科学基金项目(2020J01468).*通信作者:林志贤


Low-power Face Detection Acceleration System Based on the Zynq Platform
Author:
Affiliation:

(1. College of Physics and Information Engineering, Fuzhou University, Fuzhou 350108, CHN;2. Fujian Science & Technology Innovation Laboratory for Optoelectronic Information of China, Fuzhou 350108, CHN;3. School of Advanced Manufacturing, Fuzhou University, Quanzhou 362200, CHN)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    基于CPU及GPU的卷积神经网络平台存在体积大、能耗高等问题,提出了一种基于Zynq平台的卷积神经网络人脸检测加速系统。该系统采用YOLOv3-Tiny算法,并利用Wider Face人脸数据集进行训练。为提高网络效率,采用层融合技术减小网络深度,加快检测速度;同时,采用8位整数量化策略,以降低内存访问量,减少资源消耗。通过利用ZynqXC7Z035芯片上FPGA端并行计算能力,设计出可重复利用的多通道卷积计算模块,实现DSP的重复递用。实验结果显示,所设计的加速系统实现了9.5FPS的实时推理速度,检测速度是intel i7-8700CPU的7.9倍,系统功耗仅为2.65W,满足低功耗的性能需求。

    Abstract:

    To address the issues of large size and high power consumption in CPU- and GPU-based convolutional neural network platforms, we designed and implemented a convolutional neural network-assisted face detection acceleration system based on the Zynq platform in this study. We adopted the YOLOv3-Tiny algorithm for the proposed system and used the WIDER FACE dataset for training. To improve the network efficiency, we utilized a layer-fusion technique for reducing the network depth and accelerating detection. Moreover, we employed an 8-bit integer quantization strategy to minimize memory access and resource consumption. We designed a reusable multichannel convolution computation module by leveraging the parallel computing capability of field-programmable gate arrays (FPGAs) on the ZynqXC7Z035 chip to reuse the digital signal processor (DSP). The experimental results showed that our designed acceleration system, which could achieve a real-time inference speed of 9.5FPS, was 7.9 times faster than intel i7-8700CPU and consumed only 2.65W of power, satisfying the performance requirement of low power consumption.

    参考文献
    相似文献
    引证文献
引用本文

赵民,徐胜,韩路宇,林志贤.基于Zynq平台的低功耗人脸检测加速系统[J].半导体光电,2024,45(3):469-476. ZHAO Min, XU Sheng, HAN Luyu, LIN Zhixian. Low-power Face Detection Acceleration System Based on the Zynq Platform[J].,2024,45(3):469-476.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-12-25
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-07-11
  • 出版日期:
文章二维码

漂浮通知

①《半导体光电》新近入编《中文核心期刊要目总览》2023年版(即第10版),这是本刊自1992年以来连续第10次被《中文核心期刊要目总览》收录。
②目前,《半导体光电》已入编四个最新版高质量科技期刊分级目录,它们分别是中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》(T3)、中国图象图形学学会《图像图形领域高质量科技期刊分级目录》(T3)、中国电工技术学会《电气工程领域高质量科技期刊分级目录》(T3)和中国照明学会《照明领域高质量科技期刊分级目录》(T2)。
③关于用户登录弱密码必须强制调整的说明
④《半导体光电》微信公众号“半导体光电期刊”已开通,欢迎关注