社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

深度学习目标检测在实际场景中的应用(附源代码)

小白学视觉 • 2 年前 • 277 次点击  

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

目标检测是现在最热门的研究课题,目前最流行的还是Yolo系列框架,最近我们计算机视觉研究院也分享了很对目标检测干活及实践,都是Yolo-Base框架,今天我们分享一个经过修改后的Yolov5,实时检测的效果!

开源代码:https://github.com/ultralytics/yolov5/releases

01

前言

目标检测是现在最热门的研究课题,现在的框架越来越多,但是技术的新颖性到了瓶颈,目前开始流行Transformer机制,而且在目标检测领域也能获得较大的提升,也是目前研究的一个热点。

即将举行的亚运会,将会投入更多的先进科技,比如3D成像、姿态估计、目标检测、跟踪及识别!让去全世界看到不一样的中国,不一样的科技,不一样的亚运会。今天我们就说说目标检测会在亚运会中的体现!

目前最流行的还是Yolo系列框架,最近我们“计算机视觉研究院”也分享了很对目标检测干活及实践,都是Yolo-Base框架。

  • 高斯YoloV3目标检测(文中供源码链接)
  • Yolo轻量级网络,超轻算法在各硬件可实现工业级检测效果(附源代码)
  • 不再只有Yolo,现在轻量级检测网络层出不穷(框架解析及部署实践)
  • CVPR21目标检测新框架:不再是YOLO,而是只需要一层特征(干货满满,建议收藏)

02

新框架改进

今天我们分享一个经过简单优化过的Yolov5,暂时命名为:Pad-YoloV5,在IPad上可以实时检测!基于YoloV5框架,熟悉的同学应该都不用多加解释。

YoloV4在YoloV3的基础上增加了近两年的研究成果,如下:

  1. 输入端采用mosaic数据增强
  2. Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。(cspnet减少了计算量的同时可以保证准确率)
  3. Mish函数为:
  4. Neck中采用了SPP、FPN+PAN的结构,
  5. 输出端则采用CIOU_Loss、DIOU_nms操作

YoloV5主要的改变,如下:

  1. 输入端:Mosaic数据增强、自适应锚框计算

  2. Backbone:Focus结构,CSP结构

  3. Neck:FPN+PAN结构

  4. Prediction:GIOU_Loss

这次主要优化,是YoloV5在数据增强的时候,用随机缩放随机裁剪随机排布的方式进行拼接,这个对于小目标的检测效果还是很友好的。通过实验发现,这个随机拼接和有规律的拼接,最终的结果还是有一点差别的。

首先我通过修改数据增强的策略,开始对整体数据集进行统计(也就是数据预处理分析),我大致分成三个范围。将最大的与最小的进行随机拼接,最终结果确实比整体随机的效果好!

其次,稍微修改了下自适应图片缩放策略,Yolov5代码中datasets.py的letterbox函数中进行了修改,对原始图像自适应的添加最少的黑边。我是在自适应缩放后的图片,我在右下角位置填边,其实大多数数据没有什么变化,只是随便改改,因为在线都是在Yolo的基础上增加最近几年新出的策略,确实在最后的检查有一定效果的增加。
最后的修改,就是辛苦的把Transformer机制加进了YoloV5的基础框架中,训练确实加快了,但是对于用笔记本训练的成果物,还是不够明显。这也是最近第一次分享实践过程的一些小心思,具体的细节我们“计算机视觉研究院”后期会通过一篇干活详细和大家分享!

好消息!

小白学视觉知识星球

开始面向外开放啦👇👇👇



下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/149179
 
277 次点击