25篇最新CV领域综述性论文速递！涵盖15个方向：目标检测/图像处理/姿态估计/医学影像/人脸识别等方向…

2023年4月8日上午10:20 • 目标检测

点击上方“3D视觉工坊”，选择“星标”

干货第一时间送达

25篇最新CV领域综述性论文速递！涵盖15个方向：目标检测/图像处理/姿态估计/医学影像/人脸识别等方向...

目标检测

1. 综述：深度域适应目标检测

标题：Deep Domain Adaptive Object Detection: a Survey

作者：Wanyi Li, Peng Wang

链接：https://arxiv.org/abs/2002.06797

本文共梳理了40篇相关文献，由中科院自动化所学者发布。基于深度学习(DL)的目标检测已经取得了很大的进展，这些方法通常假设有大量的带标签的训练数据可用，并且训练和测试数据从相同的分布中提取。然而，这两个假设在实践中并不总是成立的。深域自适应目标检测(DDAOD)作为一种新的学习范式应运而生。本文综述了深域自适应目标检测方法的研究进展。

2. 深度学习中的异常实例检测：综述

标题：Anomalous Instance Detection in Deep Learning: A Survey

作者：Saikiran Bulusu, Dawn Song

链接：https://arxiv.org/abs/2003.06979

本文共梳理了119篇相关文献，由雪城大学学者发布。讨论多种异常实例检测方法，并分析了各种方法的相对优势和劣势。

3. 使用移动摄像机检测移动物体：全面综述

标题：Moving Objects Detection with a Moving Camera: A Comprehensive Review

作者：Marie-Neige Chapel, Thierry Bouwmans

链接：https://arxiv.org/abs/2001.05238

本文共梳理了347篇相关文献。随着移动传感器的兴起，研究移动相机逐渐变为热门方向。本文对不同现有方法进行了识别，并将其分为一个平面或多个两类。在这两个类别中，将各类方法分为8组：全景背景减法，双摄像头，运动补偿，子空间分割，运动分割，平面+视差，多平面和按块分割图像。本文还对公开可用的数据集和评估指标进行了研究。

图像分类

4. 图像分类中的半监督，自我监督和无监督技术综述

标题：A survey on Semi-, Self- and Unsupervised Techniques in Image Classification

作者：Lars Schmarje, Reinhard Koch

链接：https://arxiv.org/abs/2002.08721

本文共梳理了51篇相关文献。综述了标签较少的图像分类中常用的21种技术和方法。我们比较方法，并确定了三个主要趋势。

图像去噪

5. 图像去噪深度学习：综述

标题：Deep Learning on Image Denoising: An overview

作者：Chunwei Tian, Chia-Wen Lin

链接：https://arxiv.org/abs/1912.13171

本文梳理了238篇相关文献，由哈尔滨工业大学、广东工业大学、清华大学学者共同发布。不同类型的处理噪声深度学习方法存在巨大差异，而目前很少有相关研究来进行相关总结。本文对图像去噪中不同深度学习技术进行了比较研究，分析不同方法的动机和原理，并在公共去噪数据集进行比较。研究包括：(1). 加白噪声图像的CNN；(2)用于真实噪声图像的CNN；(3)用于盲噪声去噪的CNN；(4)用于混合噪声图像的CNN。

图像分割

6. 使用深度学习进行图像分割：综述

标题：Image Segmentation Using Deep Learning: A Survey

作者：Shervin Minaee, Demetri Terzopoulos

链接：https://arxiv.org/abs/2001.05566

本文梳理了172篇相关文献，对语义和实例分割文献进行了全面回顾，涵盖了的各种开创性作品，包括全卷积像素标记网络，编码器-解码器体系结构，多尺度以及基于金字塔的方法，递归网络，视觉注意模型以及对抗中的生成模型。

人脸识别

7. DeepFakes：面部操纵和伪造检测综述

标题：DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection

作者：Ruben Tolosana, Javier Ortega-Garcia

链接：https://arxiv.org/abs/2001.00179

本文梳理了105篇相关文献，本文对操纵人脸的图像技术（包括DeepFake方法）以及检测此类技术的方法进行了全面综述。论述了四种类型的面部操作：全脸合成、面部身份交换（DeepFakes）、面部属性操作以及面部表情操作。

姿态估计

8. 目标姿态回顾：从3D边界框检测器到完整的6D姿态估计器

标题：A Review on Object Pose Recovery: from 3D Bounding Box Detectors to Full 6D Pose Estimators

作者：Caner Sahin, Tae-Kyun Kim

链接：https://arxiv.org/abs/2001.10609

本文梳理了206篇相关文献，由伦敦帝国理工学院学者发布。本文对3D边界框检测器到完整的6D姿态估计器的物体姿态恢复方法的进行了首次全面的综述。基于数学模型，将各类方法分为分类，回归，分类与回归，模板匹配和点对特征匹配任务。

行为/动作识别

9. 基于3D骨架的动作识别学习方法的研究

标题：A Survey on 3D Skeleton-Based Action Recognition Using Learning Method

作者：Bin Ren, Hong Liu

链接：https://arxiv.org/abs/2002.05907

本文梳理了81篇相关文献，由北京大学学者发布。本文强调了动作识别的必要性和3D骨架数据的重要性，然后以数据驱动的方式对基于递归神经网络，基于卷积神经网络和基于图卷积网络的主流动作识别技术进行了全面介绍，这也是第一次对使用3D骨架数据进行基于深度学习的动作识别的全面研究。

人群计数

10. 基于CNN的密度估算和人群计数：综述

标题：CNN-based Density Estimation and Crowd Counting: A Survey

作者：Guangshuai Gao, Yunhong Wang

链接：https://arxiv.org/abs/2003.12783

本文梳理了222篇相关文献，由北京航空航天大学学者发布，基于CNN的密度图估计方法，调研了220+工作，对人群计数进行了全面系统的研究。同时根据评估指标，在人群统计数据集上选择表现最好的三名，并分析其优缺点。

医学影像

11. 使用经典和深层神经网络进行的乳房组织病理学图像分析的全面综述

标题：A Comprehensive Review for Breast Histopathology Image Analysis Using Classical and Deep Neural Networks

作者：Xiaomin Zhou, Tao Jiang

链接：https://arxiv.org/abs/2003.12255

本文梳理了180篇相关文献，由东北大学学者发布。对基于人工神经网络的BHIA技术进行了全面概述，将BHIA系统分为经典和深度神经网络以进行深入研究，分析现有模型以发现最合适的算法，并提供可公开访问的数据集。

12. 使用深度神经网络的医学图像配准：全面综述

标题：Medical Image Registration Using Deep Neural Networks: A Comprehensive Review

作者：Hamid Reza Boveiri, Ali Reza MehdiZadeh

链接：https://arxiv.org/abs/2002.03401

本文梳理了117篇相关文献，对使用深度神经网络进行医学图像配准的最新文献进行了全面回顾，系统地涵盖了该领域的相关作品，包括关键概念，统计分析，关键技术，主要贡献，挑战和未来方向。

13. 迈向自动威胁检测：X射线安全成像中深度学习进展综述

标题：Towards Automatic Threat Detection: A Survey of Advances of Deep Learning within X-ray Security Imaging

作者：Samet Akcay, Toby Breckon

链接：https://arxiv.org/abs/2001.01293

本文梳理了151篇相关文献，由英国杜伦大学学者发布。本文分常规机器学习和当代深度学习两类来回顾X射线安全成像算法。将深度学习方法分为有监督，半监督和无监督学习，着重论述分类，检测，分割和异常检测任务，同时包含有完善的X射线数据集。

14. 用于计算组织病理学的深度神经网络模型综述

标题：Deep neural network models for computational histopathology: A survey

作者：Chetan L. Srinidhi, Anne L. Martel

链接：https://arxiv.org/abs/1912.12378

本文梳理了130篇相关文献，由多伦多大学学者发布。本文对组织病理学图像分析中使用的最新深度学习方法进行了全面回顾，包括有监督，弱监督，无监督，迁移学习等领域，并总结了几个现有的开放数据集。

三维重建

15. 外部形状对3D内部结构预测综述

标题：A Survey On 3D Inner Structure Prediction from its Outer Shape

作者：Mohamed Mejri, Cédric Pradalier

链接：https://arxiv.org/abs/2002.04571

本文梳理了81篇相关文献，由北京大学学者发布。由于过去与骨架数据相关内容很少，本文是第一篇针对使用3D骨架数据进行基于深度学习的动作识别进行全面讨论的研究。本文突出了动作识别和3D骨架数据的重要性，以数据驱动的方式对基于递归神经网络、卷积神经网络和图卷积网络的主流动作识别技术进行了全面介绍。并介绍了最大的3D骨架数据集NTU-RGB+D及其新版本NTU-RGB+D 120，并论述了几种现有的顶级算法。

三维点云

16. 点云的无目标配准综述

标题：Target-less registration of point clouds: A review

作者：Yue Pan

本文对48篇文献进行了梳理，总结了无目标点云配准的基本工作，回顾了三种常用的配准方法，即基于特征匹配的方法，迭代最近点算法和随机假设，并分析了这些方法的优缺点，介绍它们的常见应用场景。

链接：https://arxiv.org/abs/1912.12756

OCR：

17. 手写光学字符识别（OCR）：综合系统文献综述（SLR）

标题：Handwritten Optical Character Recognition (OCR): A Comprehensive Systematic Literature Review (SLR)

作者：Jamshed Memon, Rizwan Ahmed Khan

链接：https://arxiv.org/abs/2001.00139

本文对142篇相关文献进行了梳理，总结了有关OCR的研究，综述了2000年至2018年之间发布的研究文章，介绍OCR的最新结果和技术，并分析研究差距，以总结研究方向。

深度depth相关：

18. 基于深度学习的单目深度估计：综述

标题：Monocular Depth Estimation Based On Deep Learning: An Overview

作者：Chaoqiang Zhao, Feng Qian

链接：https://arxiv.org/abs/2003.06620

本文对119篇相关文献进行了梳理，由华东理工大学学者发布。随着深度神经网络的迅速发展，基于深度学习的单眼深度估计已得到广泛研究。为了提高深度估计的准确性，提出了各种网络框架，损失函数和训练策略。因此，本文综述了当前基于深度学习的单眼深度估计方法，总结了几种基于深度学习的深度估计中广泛使用的数据集和评价指标，同时根据不同的训练方式回顾了一些有代表性的现有方法：有监督，无监督和半监督。

CNN

19. 卷积神经网络的概述论文:分析、应用和展望

标题：A Survey of Convolutional Neural Networks: Analysis, Applications, and Prospects

作者：Zewen Li, Wenjie Yang, Shouheng Peng, Fan Liu

链接：https://arxiv.org/abs/2004.02806

本文对119篇相关文献进行了梳理，由华东理工大学学者发布。本文旨在在卷积神经网络这个快速增长的领域中尽可能提供新颖的想法和前景，不仅涉及二维卷积，而且涉及一维和多维卷积。首先，本文简要介绍了CNN的历史并概述了CNN发展，介绍经典CNN模型，重点论述使它们达到SOTA的关键因素，并通过实验分析提供了一些经验法则，最后对一维，二维和多维卷积的应用进行了概述。

视觉常识/其他

20. 神经网络分类器的信息平面分析研究述评

标题：On Information Plane Analyses of Neural Network Classifiers -- A Review

作者：Bernhard C. Geiger

链接：https://arxiv.org/abs/2003.09671

21. 低功耗深度学习和计算机视觉方法的概述

标题：A Survey of Methods for Low-Power Deep Learning and Computer Vision

作者：Abhinav Goel, George K. Thiruvathukal

链接：https://arxiv.org/abs/2003.11066

22. 深度学习遇到数据对齐时：深度注册网络（DRN）评述

标题：When Deep Learning Meets Data Alignment: A Review on Deep Registration Networks (DRNs)

作者：Victor Villena-Martinez, Robert B. Fisher

链接：https://arxiv.org/abs/2003.03167

23. 面向消费设备的无限制掌纹识别：文献综述

标题：Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review

作者：Adrian-S. Ungureanu, Peter Corcoran

链接：https://arxiv.org/abs/2003.00737

24. 基于地面纹理的本地化功能-综述

标题：Features for Ground Texture Based Localization -- A Survey

作者：Jan Fabian Schmid, Rudolf Mester

链接：https://arxiv.org/abs/2002.11948

25. 从观看到移动：视觉室内导航（VIN）学习综述

标题：From Seeing to Moving: A Survey on Learning for Visual Indoor Navigation (VIN)

作者：Xin Ye, Yezhou Yang

链接：https://arxiv.org/abs/2002.11310

上述内容，如有侵犯版权，请联系作者，会自行删文。

推荐阅读：

吐血整理|3D视觉系统化学习路线

那些精贵的3D视觉系统学习资源总结（附书籍、网址与****）

超全的3D视觉数据集汇总

大盘点|6D姿态估计算法汇总(上)

大盘点|6D姿态估计算法汇总（下）

机器人抓取汇总|涉及目标检测、分割、姿态识别、抓取点检测、路径规划

汇总|3D点云目标检测算法

汇总|3D人脸重建算法

那些年，我们一起刷过的计算机视觉比赛

总结|深度学习实现缺陷检测

深度学习在3-D环境重建中的应用

汇总|医学图像分析领域论文

大盘点|OCR算法汇总

重磅！3DCVer-知识星球和学术交流群已成立

3D视觉从入门到精通知识星球：针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕，更有各类大厂的算法工程人员进行技术指导，800+的星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

欢迎加入我们公众号读者群一起和同行交流，目前有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

25篇最新CV领域综述性论文速递！涵盖15个方向：目标检测/图像处理/姿态估计/医学影像/人脸识别等方向...

▲长按加群或投稿

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：25篇最新CV领域综述性论文速递！涵盖15个方向：目标检测/图像处理/姿态估计/医学影像/人脸识别等方向… - Python技术站

人工智能目标检测

0 0 打赏

微信扫一扫

支付宝扫一扫

[论文解读]CVPR 2018|RefineDet:Single-Shot Refinement Neural Network for Object Detection 结合单双阶段的优点做目标检测

上一篇 2023年4月8日上午10:20

目标检测 | 火焰烟雾检测论文（实验部分）

下一篇 2023年4月8日上午10:21

Keras模型的保存方式

在运行并且训练出一个模型后获得了模型的结构与许多参数，为了防止再次训练以及需要更好地去使用，我们需要保存当前状态基本保存方式 h5 # 此处假设model为一个已经训练好的模型类 model.save(‘my_model.h5’) 转换为json格式存储基本参数 # 此处假设model为一个已经训练好的模型类 json_string = model.to_…

Keras 2023年4月8日
000
Caffe

faster-rcnn(testing): ubuntu14.04+caffe+cuda7.5+cudnn5.1.3+opencv3.0+matlabR2014a环境搭建记录

python版本的faster-rcnn见我的另一篇博客: py-faster-rcnn(running the demo): ubuntu14.04+caffe+cuda7.5+cudnn5.1.3+python2.7环境搭建记录 1. 首先需要配置编译caffe的环境,并降级gcc为4.7.见: ubuntu14.04下安装cudnn5.1.3,op…

2023年4月7日
000
卷积神经网络

什么是卷积convolution

定义卷积是两个变量在某范围内相乘后求和的结果。如果卷积的变量是序列x(n)和h(n)，则卷积的结果，其中星号*表示卷积。当时序n=0时，序列h(-i)是h(i)的时序i取反的结果；时序取反使得h(i)以纵轴为中心翻转180度，所以这种相乘后求和的计算法称为卷积和，简称卷积。另外，n是使h(-i)位移的量，不同的n对应不同的卷积结果。如果卷积的…

2023年4月8日
000
caffe 安装资料整理

最近在安装caffe,因为过程繁琐，而且不同的作者给出了不同的安装教程，鱼龙混杂，所以做了个简单的整理。基本安装方法在下面博客上面都有详细介绍，不过不同版本的硬件适配不同版本的软件，所以安装的时候一定要注意。有caffe需求的可以参考下，因为涉及到系统的安装，为了避免格错盘，重要资料一定要些备份好。安装比较繁琐，没有需求的最好暂时不要花精力在这个上面。主…

Caffe 2023年4月7日
000
用numpy实现CNN卷积神经网络

为了加深对卷积神经网络底层原理的理解，本文通过使用numpy来搭建一个基础的包含卷积层、池化层、全连接层和Softmax层的卷积神经网络，并选择relu作为我们的激活函数，选择多分类交叉熵损失函数，最后使用了mnist数据集进行了训练和测试。关于卷积网络的详细原理和实现可参考下列文章：刘建平Pinard：卷积网络前向反向传播算法卷积层的反向传播手把手…

卷积神经网络 2023年4月8日
000
强大而精致的机器学习调参方法：贝叶斯优化强大而精致的机器学习调参方法：贝叶斯优化

一、简介贝叶斯优化用于机器学习调参由J. Snoek(2012)提出，主要思想是，给定优化的目标函数(广义的函数，只需指定输入和输出即可，无需知道内部结构以及数学性质)，通过不断地添加样本点来更新目标函数的后验分布(高斯过程,直到后验分布基本贴合于真实分布。简单的说，就是考虑了上一次参数的信息**，从而更好的调整当前的参数。他与常规的网格搜索或者随机…

机器学习 2023年4月15日
000
Keras

keras神经网络做简单的回归问题

咸鱼了半个多月了，要干点正经事了。最近在帮老师用神经网络做多变量非线性的回归问题，没有什么心得，但是也要写个博文当个日记。该回归问题是四个输入，一个输出。自己并不清楚这几个变量有什么关系，因为是跟遥感相关的，就瞎做呗。数据预处理的选择刚开始选取了最大最小值的预处理方法，调了很久的模型但是最后模型的输出基本不变。换了z-score的预处理方法，模型的…

2023年4月8日
000
目标检测

用opencv的DNN模块做Yolov5目标检测(纯干货，源码已上传Github)

https://mp.weixin.qq.com/s/xceYQZ3xEG1tT7xL-dFuYQ 最近在微信公众号里看到多篇讲解yolov5在openvino部署做目标检测文章，但是没看到过用opencv的dnn模块做yolov5目标检测的。长按扫描二维码关注我们最近在微信公众号里看到多篇讲解yolov5在openvino部署做目标检测文章，但…

2023年4月8日
000