深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作)

2023年4月13日下午9:08 • 深度学习

神经网络构架：主要时表示神经网络的组成，即中间隐藏层的结构

对图片进行说明：我们可以看出图中的层数分布：

input layer表示输入层，维度(N_num, input_dim) N_num表示输入层的样本个数， input_dim表示输入层的维度，即变量的个数

hidden layer1 表示第一个隐藏层，维度(input_dim, hidden_dim1input_dim表示输入层的维度，hidden_dim1示隐藏层的维度

hidden layer2 表示第二个隐藏层，维度(hidden_dim1, num_classes) hidden_dim1表示隐藏层的维度， num_classes表示输出的样本的类别数

output layer 表示输出结果层, 维度(N_num, num_classes) N_num 表示输入层的样本个数， num_classes表示类别数，即每个样本对于的类别得分值

代码：对于隐藏层的参数w和b的初始化

        self.params['W1'] = weight_scale * np.random.randn(input_dim, hidden_dim)     
        self.params['b1'] = np.zeros((1, hidden_dim))    
        self.params['W2'] = weight_scale * np.random.randn(hidden_dim, num_classes)  
        self.params['b2'] = np.zeros((1, num_classes))

深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作)

2.激活函数讨论，加入激活函数的目的是为了在分类过程中，使得分类的判别式是非线性的方程即： f = σ(w*x+b) , σ表示非线性激活函数

深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作)

但是对于sigmoid激活函数存在一个问题，即在进行梯度回传时，存在一个问题，即容易发生梯度消失的问题， (1-σ(x)) * σ(x) σ(x) 表示经过sigmoid变化后的输入结果

当x值较大时， dσ / dx 的梯度值较小，即根据链式法则，每次都乘以较小的梯度值，因此到最后就容易出现梯度消失的情况

深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作)

对于ReLU激活函数的梯度回传，进行求导时，当输入值X小于0时，回传值为0，当输入值大于等于0时，回传值即是本身，因此激活函数本身不会造成梯度消失问题

代码：

x = cache
dout[x < 0] = 0

3. 数据预处理，即对输入的图片，对每张图片减去均值，在除以标准差的操作

深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作)

代码：

   # 对图片做平均操作
    mean_img = np.mean(X_train, axis=0, keepdims=True)

    X_train -= mean_img
    X_val -= mean_img
    X_test -= mean_img

4. dropout，关闭中间的几个隐藏层表示不进行参数的更新操作

深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作)

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习原理与框架-神经网络架构 1.神经网络构架 2.激活函数(sigmoid和relu) 3.图片预处理(减去均值和除标准差) 4.dropout(防止过拟合操作) - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

深度学习原理与框架-卷积网络细节-网络设计技巧 1. 3个3*3替换7*7卷积核 2. 1*1 和 3*3 替换 3*3卷积核

上一篇 2023年4月13日

深度学习原理与框架-卷积网络细节-数据增强策略 1.翻转 2.随机裁剪 3.平移 4.旋转角度

下一篇 2023年4月13日

深度学习

深度学习性能提升的诀窍 How To Improve Deep Learning Performance

原文： How To Improve Deep Learning Performance 作者： Jason Brownlee 翻译： KK4SBB 责编：何永灿克服过拟合和提高泛化能力的20条技巧和诀窍你是如何提升深度学习模型的效果？这是我经常被问到的一个问题。有时候也会换一种问法：我该如何提高模型的准确率呢？ ……或者反过来问：如果我的网络模…

2023年4月10日
000
深度强化学习方向论文整理

一. 开山鼻祖DQN 1. Playing Atari with Deep Reinforcement Learning，V. Mnih et al., NIPS Workshop, 2013. 2. Human-level control through deep reinforcement learning, V. Mnih et al., Natu…

深度学习 2023年4月13日
000
深度学习

深度学习之残差网络

资料下载链接：https://pan.baidu.com/s/1mTqblxzWcYIRF7_kk8MQQA 提取码：7x6w 资料的下载真的很感谢(14条消息) 【中文】【吴恩达课后编程作业】Course 4 – 卷积神经网络 – 第二周作业_何宽的博客-CSDN博客我找了几天resnet50.h5。【博主使用的python版本：3.6.8】对…

2023年4月9日
000
深度学习对抗生成网络使用生成对抗网络生成图片

这是最新找到的对抗生成网络的代码，亲测可以跑通。前几天也上传了一个网上找到的代码，但是这回这个代码中判别网络的假数据中加入了 detach() 函数，网上查找说这个函数可以切断神经网络的反向传导，虽然不是很理解，但总是感觉这个更对一些。对于 detach 这个函数在这里面的作用网上怎么说的都有，不过个人感觉最有说服力的说法是减少没有必要的运算，毕…

深度学习 2023年4月13日
000
《C语言深度解剖》学习笔记之关键字

第一章关键字　　C语言共有32个关键字。关键字 auto 声明自动变量 int 声明整型变量 long 声明长整型变量 char 声明字符型变量 float 声明浮点型变量 short 声明短整型变量 double 声明双精度变量 signed 声明有符号类型变量 unsigned 声明无符号类型变量 struct 声明结构体变量 union 声明…

深度学习 2023年4月11日
000
深度学习

深度学习入门一周，我都做了些什么

零基础，进入这个大火的圈子，实验室里面这方面的大牛不少，但对于一个渣前端来说，还是需要时间研究的。我就记录一下，我在没有时间的情况下，入门一周都做了些什么？怎么做的？主要是记录一下看了些什么做了些什么，明白了什么？因为老师要求一周内要抛出一个demo来，所以我就直奔主题，先了解深度学习是什么，神经网络是什么，深度学习框架是什么，框架怎么用，安装，跑官方示例…

2023年4月10日
000
深度学习

深度学习炼丹-不平衡样本的处理

数据层面的处理方法总的来说分为**数据扩充和数据采样法**，数据扩充会直接改变数据样本的数量和丰富度，采样法的本质是使得输入到模型的训练集样本趋向于平衡，即各类样本的数目趋向于一致。前言一，数据层面处理方法 1.1，数据扩充 1.2，数据（重）采样数据采样方法总结 1.3，类别平衡采样二，算法（损失函数）层面处理方法 2.1，Focal Loss 2…

2023年4月9日
000
什么样的数据集不适合用深度学习?

github博客传送门csdn博客传送门什么样的数据集不适合用深度学习？数据集太小,数据样本不足时,深度学习相对其它机器学习算法,没有明显优势。数据集没有局部相关特性,目前深度学习表现比较好的领域主要是图像／语音／自然语言处理等领域,这些领域的一个共性是局部相关性。图像中像素组成物体，语音信号中音位组合成单词，文本数据中单词组合成句子,这些特征元素的组…

深度学习 2023年4月12日
000

合作推广

合作推广

返回顶部