吴恩达《深度学习》第一门课（4）深层神经网络

2023年4月11日上午10:06 • 深度学习

4.1深层神经网络

（1）到底是深层还是浅层是一个相对的概念，不必太纠结，以下是一个四层的深度神经网络：

吴恩达《深度学习》第一门课（4）深层神经网络

（2）一些符号定义：

a^[0]=x（输入层也叫做第0层）

L=4：表示网络的层数

g:表示激活函数

第l层输出用a^[l]，最终的输出用a^[L]表示

n^[1]=5:表示第一层有五个神经元，第l层神经元个数用n^[l]表示

4.2前向传播和反向传播

（1）前向传播：输入a^[l-1],输出是a^[l],缓存为z^[l]，步骤如下：（下面第一个式子应该是a^[l-1]）

吴恩达《深度学习》第一门课（4）深层神经网络

向量化：

吴恩达《深度学习》第一门课（4）深层神经网络

（2）反向传播:输入da^[l],输出da^[l-1],dw^[l],db^[l]

吴恩达《深度学习》第一门课（4）深层神经网络

（4）da^[l-1]=w^[l]T·dz^[l]

由第四个式子带入到第一各式子中得

吴恩达《深度学习》第一门课（4）深层神经网络

向量化：

吴恩达《深度学习》第一门课（4）深层神经网络

（3）总结：第一层可能是Relu激活函数，第二层为另一个Relu函数，第三层可能是sigmoid函数（如果做二分类的话），输出值为a[L],用来计算损失，这样就可以以向后迭代进行反向传播就到来求dw[3],db[3],dw[2],db[2],dw[1],db[1].在计算的时候，缓存会把z[1]z[2]z[3]传递过来，然后回传da[2],da[1],可以用来计算da[0],但是不会使用它。整个过程如下图所示

吴恩达《深度学习》第一门课（4）深层神经网络

4.3深层网络的前向传播

（1）前向传播归纳为：

吴恩达《深度学习》第一门课（4）深层神经网络

向量化实现过程：

吴恩达《深度学习》第一门课（4）深层神经网络

4.4核对矩阵的维数

（1）w的维度是（下一层的维数，上一层的维数），即w^[l]:(n^[l],n^[l-1])

（2）b的维度时（下一层的维数，1）

（3）z^[l],a^[l]:(n^[l],1)

（4）dw^[l]和w^[l]维度相同，db^[l]和b^[l]维度相同，且w,b向量化维度不变，但z,a以及x的维度会向量化后发生改变。

向量化后：

Z^[l]:(n^[l],m)，A^[l]同Z^[l]

4.5为什么使用深层表示

增加网络的深度比广度更有效。

4.6搭建神经网络块

（1）针对一层的正向和反向传播：

吴恩达《深度学习》第一门课（4）深层神经网络

（2）整个过程示意图：

吴恩达《深度学习》第一门课（4）深层神经网络

4.7参数VS超参数

（1）W，b是参数

（2）学习率、迭代次数、层数、每层的单元数、momentum、mini batch size、regularization perameters等能影响W、b的都称为超参数，超参数的选择需要不断尝试和靠经验，以及一些策略。

4.8深度学习和大脑的关联性

深度学习和大脑其实没什么直接关系。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：吴恩达《深度学习》第一门课（4）深层神经网络 - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

神经网络与深度学习[邱锡鹏] 第九章、第十章习题解析

上一篇 2023年4月11日

吴恩达《深度学习》第一门课（2）神经网络的编程基础

下一篇 2023年4月11日

北大邹磊：图数据库中的子图匹配算法

本次讲座从图数据库中的核心查询算子——子图匹配入题，介绍了图数据库的基本概念、子图匹配的算法，以及在图数据库环境下的子图匹配查询优化等内容。导读：本次讲座从图数据库中的核心查询算子——子图匹配入题，介绍了图数据库的基本概念、子图匹配的算法，以及在图数据库环境下的子图匹配查询优化等内容。具体包括下面三个方面：什么是图数据库子图匹配查询及其优化方法我们…

深度学习 2023年4月12日
000
深度学习

JS做深度学习2——导入训练模型

改进项目前段时间，我做了个RNN预测金融数据的毕业设计（华尔街），当时TensorFlow.js还没有发布，我不得已使用了keras对数据进行了训练，并且拟合好了不同期货的模型，因为当时毕设的网站是用node.js写的，为了可以在网站中预测，我采取的方案是：用python进行训练和预测，然后使用node.js运行python命令，最终在浏览器上可视化出来，…

2023年4月10日
000
C++深度解析教程学习笔记（6）对象的构造和销毁

(1)从程序设计的角度看,对象只是变量,因此: ①在栈上创建对象时,成员变量初始化为随机值 ②在堆上创建对象时,成员变量初始化为随机值 ③在静态存储区创建对象时,成员变量初始化为 0 值成员变量的初始化 #include <stdio.h> class Test { private: int i; int j; public: …

深度学习 2023年4月13日
000
事实胜于雄辩,苹果MacOs能不能玩儿机器/深度(ml/dl)学习(Python3.10/Tensorflow2)

坊间有传MacOs系统不适合机器(ml)学习和深度(dl)学习，这是板上钉钉的刻板印象，就好像有人说女生不适合编程一样的离谱。现而今，无论是Pytorch框架的MPS模式，还是最新的Tensorflow2框架，都已经可以在M1/M2芯片的Mac系统中毫无桎梏地使用GPU显卡设备，本次我们来分享如何在苹果MacOS系统上安装和配置Tensorflow2框架（C…

深度学习 2023年4月13日
000
深度学习

Deep Learning 13_深度学习UFLDL教程：Independent Component Analysis_Exercise（斯坦福大学深度学习教程）

前言理论知识：UFLDL教程、Deep learning：三十九(ICA模型练习) 实验环境：win7， matlab2015b，16G内存，2T机械硬盘难点：本实验难点在于运行时间比较长，跑一次都快一天了，并且我还要验证各种代价函数的对错，所以跑了很多次。实验内容：Exercise:Independent Component Analysis。从数据…

2023年4月9日
000
怎样提高深度学习的效果？

怎么让深度学习模型获得更好的效果？这个是一直有人问我的问题，或者可以这么问？我怎么提高正确率？或者为什么我的深度神经网络效果这么差？我经常这样回复“”我给不出确切的答案，但是我能给你一些建议“” 下面我将列一些我认为会对提升学习效果有效的一些建议。我将这些想法mark到下面，这些想法不仅仅对深度学习有用，而且对机器学习同样有效。提升学习算法性能的四个建议…

深度学习 2023年4月11日
000
深度学习

5 TensorFlow实战Google深度学习框架一书中的错误两处（交叉熵定义有误）

第一处：书中62页定义的交叉熵函数定义有误，虽然这个所谓交叉熵的数值能够减少，但是是不能提升预测性能的，因为定义就错了。我已经将预测过程可视化，直接将交叉熵改为我的，或者用原书的，就可以看到预测结果的变化。第二处： 150页，lenet第三层卷积层的连接数目是（10*10*16*（5*5*6+1））=241600.因为本层输入矩阵的深度是6，输出矩阵的…

2023年4月10日
000
深度学习——无监督，自动编码器——尽管自动编码器与 PCA 很相似，but自动编码器既能表征线性变换，也能表征非线性变换；而 PCA 只能执行线性变换

自动编码器是一种有三层的神经网络：输入层、隐藏层（编码层）和解码层。该网络的目的是重构其输入，使其隐藏层学习到该输入的良好表征。自动编码器神经网络是一种无监督机器学习算法，其应用了反向传播，可将目标值设置成与输入值相等。自动编码器的训练目标是将输入复制到输出。在内部，它有一个描述用于表征其输入的代码的隐藏层。自动编码器的目标是学习函数 h(x…

深度学习 2023年4月12日
000