3.深度学习的实用层面

2023年4月10日上午2:37 • 深度学习

第一周：深度学习的实用层面

3.深度学习的实用层面

项目进展得一个关键性得因素就是划分高质量得训练集，验证集，测试集。这有助于提高循环迭代得效率。验证集也称为development set

也称为dev set。

验证集主要用于评价不同得模型，通过验证来选择最终得模型。或者说是验证不同得算法，检验那种算法更有效。

然后测试集在选择得模型上进行评估。

三种集合要来自于同一种划分。

深度学习的趋势是权衡方差和偏差

3.深度学习的实用层面

通过训练集与验证集的正确率来观察偏差和方差。假设验证集和训练集是同一分布

3.深度学习的实用层面

3.深度学习的实用层面

紫色的线部分欠拟合，部分过拟合，所以具有高偏差和高方差。

当我们训练好模型后首先要知道模型的偏差是否过高，如果偏差过高甚至无法拟合训练集，那么选择一个新的网络，比如含有更多隐藏层和隐藏单元的网络，

花费更多的时间来训练网络，直至网络拟合训练集。

之后观察方差是否过高，如果方差过高，那么采用更多的数据，或者正则化。

重复此过程，直至找到一个低偏差和低方差的网络

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

如果怀疑神经网络中出现了高方差，那么一种方法是用更多的数据。另一种方法就是用正则化方法。

在逻辑回归中使用正则化项。

3.深度学习的实用层面

w是一个高维参数矢量，b是一个实数。所以b可以忽略。如果用l1正则化，那么w讲是稀疏的，w中会有很多0。人们越来越倾向于使用l2正则化。

神经网络中的正则化也被称为权重衰减。神经网络中，参数w是一个矩阵，l2正则化其实也是计算平方和。

3.深度学习的实用层面

神经网络最后的那个计算就是让矩阵先乘以一个系数（系数小于1）（被称为权重衰减的原因），再减去那个。

直观的理解就是正则化系数如果设置的过大，那么权重矩阵就会被设置为权重趋于0的值。许多隐藏单元的值为0，其实也就是消除了这些隐藏单元的理解

dropout是一种正则化方法，中文名称为随机失活。

假设左边的神经网络存在过拟合，dropout会遍历网络的每一层，设置每一层中消除网络中节点的概率，然后删掉被删除节点进入和射出的线，从而得到一个节点更少，规模更小的网络。作用于训练阶段，在测试阶段不再用，每一次迭代都会从新计算dropout，因此每次的代价函数都不同。

3.深度学习的实用层面

dropout最常用的就是反向随机失活(inverted dropout)

3.深度学习的实用层面

d是随机生成一个向量，a是某一层输出的结果向量。a与b相乘后，a仍需要除以keep-prob

3.深度学习的实用层面

另外一种正则化防止过拟合的方法就是扩大训练集。用翻转，切割，强变形等手段

3.深度学习的实用层面

早停就是在中间点结束训练。

零均值化与方差均值化。训练集用此方法来进行归一化后，测试集也应该用此方法来进行归一化。尤其是数值不能变。

3.深度学习的实用层面

归一化有利于梯度下降。输入数据有的在0-1，有的在0-1000，那么归一化就十分有必要了。如果输入数据在相似的范围，那么归一化就没有那么有必要了。

梯度消失与梯度爆炸详解：https://blog.csdn.net/qq_25737169/article/details/78847691

较大三角形的高宽比更接近于导数，这不是一个单边公差，而是一个双边公差。双边公差更接近于导数。所以用双边公差来估计梯度。

3.深度学习的实用层面

梯度检验可以帮我们很好的发现反向传播中的bug

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

第二周：优化算法

深度学习是一个高度依赖经验的过程，并且伴随着大量的迭代过程。需要训练大量的模型，才能找到适合的那一个。

首先来谈mini-batch gradient descent算法。

吧训练集分割为一些小的集和，这些集和称为mini-batch

3.深度学习的实用层面

右上角的小括号代表第几个训练样本，中括号代表神经网络的第几层输出，大括号代表第几个mini-batch

3.深度学习的实用层面

原来的训练集被划分为许多个小的mini-batch,在每个小的mini-batch上进行一次梯度下降。

3.深度学习的实用层面

现在我们要决定的就是mini-batch的大小

3.深度学习的实用层面

优点：有效的利用了向量化，每一次的迭代时间变少。另一方面，你不需要等到整个训练集被训练完，就可以开始后续的工作。

如果训练集较小，那么就直接使用batch算法。这里说的少一半是说少于2000个样本。

划分mini-batch时，一般大小为64-512,2的幂，主要是考虑到了电脑内存。

3.深度学习的实用层面

指数加权平均法

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

在进行指数加权平均时，初期值会比较低，所以要用到偏差修正：但传统中人们一般不会考虑偏差修正。

3.深度学习的实用层面

接下来是动量梯度下降，传统的梯度下降，只计算当前的梯度，而动量梯度下降，不仅考虑到了当前的梯度，也考虑到了之前的梯度。方法就是指数加权平均。

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

学习率衰减

3.深度学习的实用层面

超参数的重要程度：红橙紫

3.深度学习的实用层面

如果超参数过多，不适宜用排列组合，而是用随机选取点的方法。

3.深度学习的实用层面

再由粗略到精细：

3.深度学习的实用层面

一些事随机均匀选取的：

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

softmax回归，最后一层输出的是概率，和为1

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

3.深度学习的实用层面

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：3.深度学习的实用层面 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

[学习笔记]C语言深度剖析

上一篇 2023年4月10日

5 TensorFlow实战Google深度学习框架一书中的错误两处（交叉熵定义有误）

下一篇 2023年4月10日

《python深度学习》笔记—8.5、生成式对抗网络简介

一、总结一句话总结：【gan可以替代VAE来学习图像的潜在空间，它能够迫使生成图像与真实图像在统计上几乎无法区分】：生成式对抗网络（GAN，generative adversarial network）由Goodfellow 等人于2014 年提出 a，它可以替代VAE 来学习图像的潜在空间。它能够迫使生成图像与真实图像在统计上几乎无法区分，从而生成…

深度学习 2023年4月12日
000
深度学习

学界 | 杜克大学NIPS 2017 Oral论文：分布式深度学习训练算法TernGrad

2017-09-11 13:26 机器之心报道作者：吴欣为了提高分布式深度学习的速度和效率，杜克大学「进化智能研究中心」陈怡然和李海教授的博士生温伟提出了 TernGrad 分布式训练算法，并与 Hewlett Packard Labs（慧与研究院）徐聪和内华达大学的颜枫教授合作，在大规模分布式深度学习中进行了有效的验证。该工作可以将浮点型的学习梯度（g…

2023年4月9日
000
使用tensorflow深度学习识别验证码

除了传统的PIL包处理图片,然后用pytessert+OCR识别意外,还可以使用tessorflow训练来识别验证码。此篇代码大部分是转载的，只改了很少地方。代码是运行在linux环境，tessorflow没有支持windows的python 2.7。 gen_captcha.py代码。 #coding=utf-8 from captcha.imag…

深度学习 2023年4月13日
000
Atitit 机器学习算法分类目录 1. 传统的机器学习算法 vs 深度学习 1 1.1. 传统的机器学习算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。 2 2. 监

Atitit 机器学习算法分类目录 1. 传统的机器学习算法 vs 深度学习 1 1.1. 传统的机器学习算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。 2 2. 监督学习与非监督学习 2 3. 连续型学习跳跃型学习 2 4. 根据学习方式分类 2 4.1. 包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboo…

深度学习 2023年4月11日
000
基于深度学习的目标跟踪

链接：基于深度学习的目标检测基于深度学习的目标检测综述目标检测算法汇聚目标检测算法总结 10行代码实现目标检测深度学习目标检测综述(作者的个人理解一刀流) TensorFlow实现的目标检测（有github）目标检测算法简介，都是文字内容摘要：R-CNN是Region-based Convolutional Neural Networks的…

深度学习 2023年4月11日
000
深度学习之 cnn 进行 CIFAR10 分类

import torchvision as tv import torchvision.transforms as transforms from torchvision.transforms import ToPILImage show = ToPILImage() import torch as t import torch.nn as nn impor…

深度学习 2023年4月16日
000
深度学习（四）之电影评论分类

任务目标对中文电影评论进行情感分类，实现测试准确率在\(83\%\)以上。本文采用了3种模型对电影评论进行分类，最终，模型在测试集的结果分别为：模型 acc precision recall f1-score LSTM \(81.57\%\) [\(77.49\%\),\(86.69\%\)] [\(88.46\%\),\(74.87%\)] [\(82…

深度学习 2023年4月12日
000
win10+Ubuntu16.04双系统下深度学习环境的搭建

环境零零碎碎地搭了三四天，虽然碰到各种问题，但还是搭建好了，自己整理记录下，同时也算给有需要的人一些指导吧一．双系统的安装 Win10硬盘管理助手压缩或者直接利用未使用的空间，空间大小自定，将腾出的磁盘空间删除卷，变成未分配状态。 2.选择ultraISO制作Ubuntu系统盘，即借由ultraIOS将系统镜像ISO刻录至U盘中，U盘实现备份重要文件…

深度学习 2023年4月16日
000

合作推广

合作推广

返回顶部