神经网络与深度学习[邱锡鹏] 第七章习题解析

2023年4月11日上午9:31 • 深度学习

明显地，埃尔法和K成正比
神经网络与深度学习[邱锡鹏] 第七章习题解析

7-2

神经网络与深度学习[邱锡鹏] 第七章习题解析

7-3

神经网络与深度学习[邱锡鹏] 第七章习题解析

7-4

神经网络与深度学习[邱锡鹏] 第七章习题解析

7-5

神经网络与深度学习[邱锡鹏] 第七章习题解析

7-6

神经网络与深度学习[邱锡鹏] 第七章习题解析

7-7

从再参数化的角度来分析批量归一化中缩放和平移的意义

在此公式中，r和b表示缩放和平移参数向量。

通过r和b，能够有效适应不同的激活函数。例如：通过r和b，可以自动调整输入分布，防止ReLU死亡问题。
有了b的存在，仿射变换不再需要偏置参数。
逐层归一化可以提高效率，并且作为一种隐形的正则化方法，提高泛化能力。

7-8

批归一化可以应用于RNN的堆栈之间，其中归一化是“垂直”应用（即每个RNN的输出），
但是它不能“水平”应用（即在时间步之间），因为重复的rescaling会导致梯度爆炸。
主要是因为RNN梯度随时间反向计算，梯度有一个累积的过程。

7-9

证明在标准的随机梯度下降中，权重衰减正则化和l2正则化的效果相同。
神经网络与深度学习[邱锡鹏] 第七章习题解析
分析这一结论在动量法和Adam算法中是否成立？

L2正则化梯度更新的方向取决于最近一段时间内梯度的加权平均值。
当与自适应梯度相结合时（动量法和Adam算法），
L2正则化导致导致具有较大历史参数 (和/或) 梯度振幅的权重被正则化的程度小于使用权值衰减时的情况。

7-10

当在循环神经网络上应用丢弃法，不能直接对每个时刻的隐状态进行随机丢弃，这样会损坏循环网络在时间维度上记忆能力。
（有点类似于7-8题，因为循环神经网络梯度计算是累加进行计算的，丢弃其中的某部分，会使得梯度计算不准确，即丢失记忆能力）

7-11

神经网络与深度学习[邱锡鹏] 第七章习题解析

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：神经网络与深度学习[邱锡鹏] 第七章习题解析 - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

神经网络与深度学习[邱锡鹏] 第六章习题解析

上一篇 2023年4月11日

神经网络与深度学习[邱锡鹏] 第五章习题解析

下一篇 2023年4月11日

强化学习 —— reinforce算法中更新一次策略网络时episodes个数的设置对算法性能的影响 —— reinforce算法中迭代训练一次神经网络时batch_size大小的不同设置对算法性能的影响深度学习中使用TensorFlow或Pytorch框架时到底是应该使用CPU还是GPU来进行运算？？？

本文相关的博客：（预先知识）强化学习中经典算法 —— reinforce算法 —— （进一步理解，理论推导出的计算模型和实际应用中的计算模型的区别）本文代码地址： https://gitee.com/devilmaycry812839668/cart-pole_-policy-network_-reinforce ==========…

深度学习 2023年4月13日
000
深度学习

神经网络和深度学习（二）浅层神经网络

1、计算神经网络的输出（正向传播）：矩阵表示：向量化： 2、多个样本的向量化（正向传播）： 3、激活函数：（1）sigmoid函数仅用于二分分类的情况，较少使用； a = 1 / (1 + e-z) g'(z) = g(z) * (1 – g(z)) （2）tanh函数绝大多数情况下优于sigmoid函数； a = (ez – e-z…

2023年4月10日
000
深度学习portoch笔记_概念随笔

空洞卷积： 2020-02-15 1.偏置参数个数 2d卷积时，如果设置该层偏置有效，偏置参数个数= 输出通道数目。 2.2d卷积分组个数限定分组个数一定要能被输入通道整除，并且要能被输出通道整除。输入通道整除原因：因为输入通道/ 分组数目要=整数。不等于整数时会发生。余数通道怎么处理问题。输出通道整除原因:不能整除会发生每个通道卷…

深度学习 2023年4月11日
000
神经网络与深度学习笔记（二）逻辑回归

逻辑回归函数是由两个函数符合而成，首先我们有sigmoid函数g(z)：当然这里面的参数可以加上各种有关theta的定值，并不一定必须就只有x之前的theta参数。然后再把g(z)拿到h(x)函数里面去拟合就可以了，h(x)则是我们的Logistic回归函数。把这两个方程拟合放到一起有： sigmoid函数长这样：由于我们是二分类的问题，因此y只有1…

深度学习 2023年4月11日
000
ubuntu18.04下搭建深度学习环境anaconda2+ cuda9.0+cudnn7.0.5+tensorflow1.7【原创】【学习笔记】

PC：ubuntu18.04、i5、七彩虹GTX1060显卡、固态硬盘、机械硬盘作者：庄泽彬(欢迎转载，请注明作者) 说明:记录在ubuntu18.04环境下搭建深度学习的环境，之前安装了cuda9.1,与cudnn7.0.5版本的，但是无论怎么安装tensorflow-gpu都是失败，后来找到原因了，目前的tensorflow暂不支持cuda9.1,因此…

深度学习 2023年4月13日
000
深度学习循环神经网络 LSTM 示例

最近在网上找到了一个使用LSTM 网络解决世界银行中各国 GDP预测的一个问题，感觉比较实用，毕竟这是找到的唯一一个可以正确运行的程序。 #encoding:UTF-8 import pandas as pd from pandas_datareader import wb import torch import torch.nn impo…

深度学习 2023年4月13日
000
吴恩达《深度学习》第二门课（1）深度学习的实用层面

1.1训练，验证，测试集（Train/Dev/Test sets）（1）深度学习是一个按照下图进行循环的快速迭代的过程，往往需要多次才能为应用程序找到一个称心的神经网络。（2）在机器学习中，通常将样本分成训练集，验证集和测试集三部分，数据规模相对较小，适合传统的划分比例（如6:2:2），数据集规模比较大的，验证集和测试集要小于数据总量的20%或者10%甚…

深度学习 2023年4月11日
000
基于深度学习的图像语义分割技术概述之背景与深度网络架构

图像语义分割正在逐渐成为计算机视觉及机器学习研究人员的研究热点。大量应用需要精确、高效的分割机制，如：自动驾驶、室内导航、及虚拟/增强现实系统。这种需求与机器视觉方面的深度学习领域的目标一致，包括语义分割或场景理解。本文对多种应用领域语义分割的深度学习方法进行概述。首先，我们给出本领域的术语及主要背景知识。其次，介绍主要的数据集及难点，以帮助研究人员找到合适…

深度学习 2023年4月11日
000

神经网络与深度学习[邱锡鹏] 第七章习题解析

7-2

7-3

7-4

7-5

7-6

7-7

7-8

7-9

7-10

7-11

相关文章