深度学习目标检测IoU的思考（持续更新）

2023年4月8日上午3:37 • 目标检测

这段时间在做表格还原的工作，属于版面分析的一个模块。目前已经能做到截图/扫描/拍照表格图像检测，表格信息提取和html写入。可以多平台使用，不需要微软的接口。但在结合ocr的文本检测和文本识别确定表格内容的过程中，只通过单元格坐标和文本检测的坐标设定规则去判定文本是否属于该单元格具有较大的风险。一是极大依赖文本检测和表格坐标提取的准确度，二是，表格框和文本检测框的重叠方式有多种，规则难以自适应。所以想到了借鉴目标检测的IoU思路作为判别条件，同时增加表格是否存在内容判别算法，可进一步减少还原误差。但是在实践过程中发现，原版的IoU并不适用表格和文本框场景。自己根据具体的情况设计了新的IoU判别思路，并仔细学习了最近两年关于IoU的改进论文。本篇博客主要参考GIoU和DIoU，欢迎交流。

DIoU的论文《Faster and Better Learning for Bounding Box Regressing》阅读笔记：

主要内容：文章讨论了IoU和GIoU的弊端，提出了一种基于CIoU(Complete IoU)的Distance-IoU(即DIoU)，并对比了IoU，GIoU和DIoU。DIoU在经典的YOLOv3，SSD和Faster R-CNN检测算法中使得mAP获得了可喜的提高。且DIoU可解决NMS带来的问题。关于IoU，GIoU和DIoU在训练中对比的可视化如图1：

深度学习目标检测IoU的思考（持续更新）

IoU梯度更新时，如果重叠区域为0，则无法跟新梯度信息。知道交并比计算值大小，无法得知实际交并情况。如下图2：

深度学习目标检测IoU的思考（持续更新）

显然最左边的回归效果最好，最右边最差。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习目标检测IoU的思考（持续更新） - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

吴恩达深度学习4.3笔记_Convolutional Neural Networks_目标检测

上一篇 2023年4月8日上午3:37

TensorFlow + Keras 实战 YOLO v3 目标检测图文并茂教程

下一篇 2023年4月8日上午3:38

目标检测

FAIR开源Detectron：整合全部顶尖目标检测算法

昨天，Facebook AI 研究院（FAIR）开源了 Detectron，业内最佳水平的目标检测平台。昨天，Facebook AI 研究院（FAIR）开源了 Detectron，业内最佳水平的目标检测平台。据介绍，该项目自 2016 年 7 月启动，构建于 Caffe2 之上，目前支持大量机器学习算法，其中包括 Mask R-CNN（何恺明的研究，ICC…

2023年4月8日
000
Machine Learning 之一，什么是机器学习。

Machine Learning 机器学习，什么是机器学习。我觉得尚学堂的培训老师讲的很不错，就是两个字来介绍。——拟人。就是模拟人类的思维方式。老师举的例子：和女朋友约会，第一次约会，约定是晚上七点到，但是女朋友7点十分才到。第二次，约会，约定也是晚上七点到，但是女朋友还是7点十分才到。那么第三次呢，这位男同志就可能会通过前两次约会的经…

机器学习 2023年4月16日
000
【机器学习】李宏毅——自监督式学习

本文介绍了近几年比较火热的自监督式学习，并介绍了其中最具有代表性的BERT算法和GPT算法，其中对BERT算法进行了详细叙述。 1、BERT简介首先需要介绍什么是自监督学习。我们知道监督学习是有明确的样本和对应的标签，将样本丢进去模型训练并且将训练结果将标签进行比较来修正模型，如下图：而自监督学习就是没有标签也要自己创建监督学习的条件，即当前只有样本x但…

机器学习 2023年4月11日
000
循环神经网络

时间序列(五): 大杀器: 循环神经网络

循环神经网络目录循环神经网络引言循环神经网络循环结构* RNN 结构* 双向循环神经网络深度循环神经网络穿越时间的反向传播算法反向传播算法* 一. 一个乘积: 二. 二个假设: 三: 三个步骤: 四: 四个基本方程**: BPTT** 总结参考方献: 引言上几节讲了一些时间序列的基本概念, 大家总感觉不那么的’智能’, 与现在的人工智能的…

2023年4月6日
000
make pycaffe时候报错：Makefile:501: recipe for target ‘python/caffe/_caffe.so’ failed

安装caffe-ssd编译环境的时候报错： python/caffe/_caffe.cpp:10:31: fatal error: numpy/arrayobject.h: No such file or directorycompilation terminated.Makefile:501: recipe for target ‘python/caffe…

Caffe 2023年4月5日
000
目标检测

无人驾驶中的目标检测–MODNet: Moving Object Detection Network for Autonomous Driving

MODNet: Moving Object Detection Network with Motion and Appearance for Autonomous Driving 这里讲视频动作识别中的 two stream networks 框架应用于无人驾驶中的目标检测，视频分析中的 motion and appearance cues 本文的 cont…

2023年4月8日
000
GAN生成对抗网络

深度学习——GAN生成对抗神经网络

Table of Contents 基本思想：训练过程： GANs的值函数 GANs如何避开大量概率推断计算 GANs在实际训练中会遇到什么问题？生成器的坍缩模式原因：解决办法：图像生成DCGAN：GANs+卷积神经网络 ALI：生成+推断+判别 IRGAN：生成离散样本，比如文本序列场景基本思想： GANs：世间万物都是在相互制约和相互对抗中逐…

2023年4月6日
000
目标检测

在CIFAR-10上用CNN进行目标检测

CIFAR-10数据集链接：http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 代码：https://e.coding.net/hanhao/hanhao0620.git 版本 ;python 3.7 pycharm2019 在我的笔记本上历时6个小时终于跑完的代码，整理笔记如下。 pycharm中导…

2023年4月8日
000

合作推广

合作推广

返回顶部