无人驾驶中的目标检测–MODNet: Moving Object Detection Network for Autonomous Driving

2023年4月8日上午3:58 • 目标检测

MODNet: Moving Object Detection Network with Motion and Appearance for Autonomous Driving

这里讲视频动作识别中的 two stream networks 框架应用于无人驾驶中的目标检测，视频分析中的 motion and appearance cues
无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

本文的 contributions 主要以下三点：
1）提出了一个新颖的多任务学习系统用于无人驾驶，它可以融合 motion and appearance cues
2）这个系统同时检测车辆和运动分割
3）我们提出了一个方法，可以将 KITTI dataset 转出本系统需要的训练数据，我们称得到的数据库为 KITTI MOD

下面首先来看看 KITTI MOD Dataset 的生成
无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving
对于车辆我们主要利用了 odometry information and annotated 3D bounding boxes ，odometry information 可以帮助我们将相机的速度得到。从 3D bounding boxes 我们可以得到 2D bounding boxes，根据 3D centroids 我们可以估算出车辆的速度，根据这个速度结合相机的速度，我们可以判断出车辆是否运动。我们可以将运动车辆区分出来。

MODNet Two Stream Multi-Task Learning Architecture
无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving
采用 VGG16 网络，输入 RGB图像和光流场

A detector similar to the detection decoder in [26] denoted as FastBox is used. It is based on Yolo[22] as a single shot detector utilizing the first 15 convolutional layers from VGG16
损失函数定义如下
无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

Experiment

无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

无人驾驶中的目标检测--MODNet: Moving Object Detection Network for Autonomous Driving

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：无人驾驶中的目标检测–MODNet: Moving Object Detection Network for Autonomous Driving - Python技术站

人工智能目标检测

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

CNN中卷积神经网络的技巧trick总结（图像识别/目标检测/语义分割）

上一篇 2023年4月8日上午3:58

ILSVRC2016目标检测任务回顾——视频目标检测（VID）

下一篇 2023年4月8日上午3:59

Caffe常用算子GPU和CPU对比

通过整理LeNet、AlexNet、VGG16、googLeNet、ResNet、MLP统计出的常用算子(不包括ReLU)，表格是对比。 Cpu版 Gpu版 for (int i = 0; i < count; ++i) { int c = (i / dim) % channels / div_factor; top_data[i]…

Caffe 2023年4月6日
000
Keras

keras的LSTM函数详解

keras.layers.recurrent.LSTM(units, activation=’tanh’, recurrent_activation=’hard_sigmoid’, use_bias=True, kernel_initializer=’glorot_uniform’, recurrent_initializer=’orthogonal’, b…

2023年4月7日
000
Keras MAE和MSE source code

def mean_squared_error(y_true, y_pred): if not K.is_tensor(y_pred): y_pred = K.constant(y_pred) y_true = K.cast(y_true, y_pred.dtype) return K.mean(K.square(y_pred – y_true), axis=…

Keras 2023年4月7日
000
Keras

Keras卷积神经网络补充

1. keras.layers.Conv2D(filters, kernel_size, strides=(1, 1), padding=’valid’, data_format=None, dilation_rate=(1, 1), activation=None, use_bias=True, kernel_initializer=’glorot_uni…

2023年4月8日
000
GAN生成对抗网络

虚构的对抗：GAN with the wind

本文授权转载自：老顾谈几何作者：顾险峰编辑：韩蕊在过去的两三年中，对抗生成网络（Generative Adersarial Network GAN）获得了爆炸式的增长，其应用范围几乎涵盖了图像处理和机器视觉的绝大多数领域。其精妙独到的构思，令人拍案叫绝；其绚烂逼真的效果，令众生颠倒。一时间对抗生成网络引发了澎湃汹涌的技术风潮，纳什均衡的概念风靡了整个人…

2023年4月6日
000
循环神经网络

从网络架构方面简析循环神经网络RNN

一、前言 1.1 诞生原因　　在普通的前馈神经网络（如多层感知机MLP，卷积神经网络CNN）中，每次的输入都是独立的，即网络的输出依赖且仅依赖于当前输入，与过去一段时间内网络的输出无关。但是在现实生活中，许多系统的输出不仅依赖于当前输入，还与过去一段时间内系统的输出有关，即需要网络保留一定的记忆功能，这就给前馈神经网络提出了巨大的挑战。除此之外，前馈神…

2023年4月8日
000
合合信息新推出反光消除技术，助力手写文字识别更精准

近期，合合信息旗下扫描全能王推出液晶手写板（简称“手写板”），为用户带来仿真、流畅的书写绘画体验，一同发布的还有扫描全能王APP的新功能“拍手写板”。该功能可帮助用户在拍摄手写板内容后去除图片上的反光干扰，形成更贴近白纸、板报的图片，并通过手写字迹识别，快捷、有序地获取可编辑、可分享的电子文档，助力工作效率提升。家庭场景中，父母可使用该功能清晰地扫描、分…

人工智能概论 2023年4月27日
000
Keras

windows下简单搭建Tensorflow，keras（GPU）环境

在本文的tensorflow的环境搭建中，所需要提前说明的是，我的安装配置的tensorflow-gpu的版本是1.10.0，且相应的cuda的版本是，提前说明的原因是tensorflow-gpu的安装版本和cuda以及cudnn的版本必须对应且正确。以下则是tensorflow-gpu不同版本的对应的cuda9.0和对应的cudnn7.3的说明图，在…

2023年4月8日
000

合作推广

合作推广

返回顶部