CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

2023年4月11日上午4:27 • 深度学习

yizhihongxing

http://www.mooc.ai/course/353/learn?lessonid=2289&groupId=0#lesson/2289

https://adeshpande3.github.io/adeshpande3.github.io/The-9-Deep-Learning-Papers-You-Need-To-Know-About.html

1.1 AlexNet：

图像输入224*224*3。11*11滤波器。2个通道，用于硬件实现。其中一个通道是5*5的。

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

1.2 VGGNet

很多变体。VGG16/19。更少参数。

feature map的尺寸不断减小，但是个数增多。因此可以说空间维度减少，但是深度增加。

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

1.3 GoogleNet

更加复杂、更深超过100层。空间上横向扩展代替纵向加深。

去掉全连接层，少了很多参数。

1*1卷积层，降维用。

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

1.4 ResNet

精度超过人类。

学习的是期望的输出与输入之间的残差。

引入残差后的映射对输出的变化更敏感。

输出变化对权重的调整作用更大，所以效果更好。残差的思想都是去掉相同的主体部分，从而突出微小的变化。

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

2、训练技巧，防止过拟合

2.1 数据增强(Data augmentation):

水平翻转, 随机裁剪和平移变换，颜色、光照变换。适应不同条件。

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

2.2 Dropout

把一些层的输出丢掉，随机不激活。

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

在训练阶段中，将假设的投影作为修改的激活函数a(h), D是伯努利分布变量：https://yq.aliyun.com/articles/68901

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

2.3 其他有助于训练的手段：

• 1.L1，L2正则化

• 2.Batch Normalization

每次进行SGD的时候，在卷积之后(Wx+b)之后进行归一化，将输出变成均值为0，方差接近1。按照batch，每一维度减去自身均值，再除以自身标准差。

优点：

1，使用更高的学习率

2，移除或者使用较低的dropout

3，降低L2权重衰减系数

3、caffe

http://caffe.berkeleyvision.org/tutorial/

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络

https://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/00-classification.ipynb

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：CV3——学习笔记-实战项目（上）：如何搭建和训练一个深度学习网络 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

【神经网络和深度学习】笔记 – 第三章如何提高神经网络学习算法的效果

上一篇 2023年4月11日

深度学习系列专题之优化方法（1）总览

下一篇 2023年4月11日

深度学习

深度学习训练数据打标签过程

为了获取大量的图片训练数据，在采集数据的过程中常用视频的方式采集数据，但对于深度学习，训练的过程需要很多的有有标签的数据，这篇文章主要是解决视频文件转换成图片文件，并加标签，最后把数据存储到pkl文件中，为后续深度学习提供数据。 1. video to image 这个应用，主要是把视频切分成图片，并保存到本地，可以自定义切分的时间间隔；在深度学习中，由于…

2023年4月9日
000
【计算机视觉】【神经网络与深度学习】YOLO v2 detection训练自己的数据2

关于用yolo训练自己VOC格式数据的博文真的不少，但是当我按照他们的方法一步一步走下去的时候发现出了其他作者没有提及的问题。这里就我自己的经验讲讲如何训练自己的数据集。 2.数据集这里建议大家用VOC和ILSVRC比赛的数据集，因为xml文件都是现成的，省去很多功夫。当然除非你是个执着的孩子就想凭借着非人的毅力和追逐斗鸡眼这种个性特征而自己去标记…

深度学习 2023年4月13日
000
三维重建：QT+OpenNI+Kinect图像校正 Kinect+OpenNI学习笔记之(获取kinect的颜色图像和深度图像)

后记：当时能不放弃这个方向是因为这里面涉及了一种很有效的三位场景存储方式，可能给出除图元建模之外的一种三维场景描述方式。这和Flash与位图的对比一样，基于图元的flash始终抵不过基于点描述的位图格式。总结：OpenNI已经有了一个专门的语句对标定进行了封装，我们不需要再费力去使用自己的代码了。原文链接…

深度学习 2023年4月10日
000
深度学习方法：受限玻尔兹曼机RBM（三）模型求解，Gibbs sampling

欢迎转载，转载请注明：本文出自Bin的专栏blog.csdn.net/xbinworld。技术交流QQ群：433250724，欢迎对算法、技术、应用感兴趣的同学增加。接下来重点讲一下RBM模型求解方法。其有用的依旧是梯度优化方法，可是求解须要用到随机採样的方法。常见的有：Gibbs Sampling和对照散度(contrastive divergence…

深度学习 2023年4月13日
000
深度学习面试题19：1*1卷积核的作用

　　举例　　在Inception module上的应用　　参考资料可以减少计算量，可以增加非线性判别能力举例假设有1个高为30、宽为40，深度为200的三维张量与55个高为5、宽为5、深度为200的卷积核same卷积，步长=1，则结果是高为30、宽为40、深度为55的三维张量，如图所示：该卷积过程的乘法计算量大约为5*5*200*30*40*55…

深度学习 2023年4月12日
000
ubuntu 深度学习cuda环境搭建，docker-nvidia 2019-02

ubuntu 深度学习cuda环境搭建 ubuntu系统版本 18.04 查看GPU型号(NVS 315 性能很差,比没有强) 首先最好有ssh服务,以下操作都是远程ssh执行 lspci | grep -i nvidia03:00.0 VGA compatible controller: NVIDIA Corporation GF119 [NVS 315]…

深度学习 2023年4月13日
000
深度学习

深度拾遗(05) – 优化算法/学习率衰减/局部最优

SGD Momentum RMSprop Adam SGD \(g_t=\nabla_{\theta_{t-1}}{f(\theta_{t-1})}\) \(\Delta{\theta_t}=-\eta*g_t\)其中，\(\eta\)是学习率，\(g_t\)是梯度 SGD完全依赖于当前batch的梯度，所以\(\eta\)可理解为允许当前batch的梯度多…

2023年4月10日
000
深度学习

实用！7个强大的Python机器学习库！⛵

本文整理了7个非常有效的机器学习Python库：Prophet、Deep Lake、Optuna、pycm、NannyML、ColossalAI、emcee，用简单的方式编写复杂且耗时的代码，大大提升工作效率！ ? 作者：韩信子@ShowMeAI? 机器学习实战系列：https://www.showmeai.tech/tutorials/41? 本文地址：h…

2023年4月9日
000

合作推广

合作推广

返回顶部