吴恩达《深度学习》第一门课（2）神经网络的编程基础

2023年4月11日上午10:07 • 深度学习

2.1二分类

（1）以一张三通道的64×64的图片做二分类识别是否是毛，输出y为1时认为是猫，为0时认为不是猫：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

y输出是一个数，x输入是64*64*3=12288的向量。

（2）以下是一些符号定义（数据集变成矩阵之后进行矩阵运算代替循环运算，更加高效）

x：表示一个n_x维数据，维度为（n_x,1）

y：表示输出结果，取值为（0,1）；

（x⁽ⁱ⁾,y⁽ⁱ⁾）：表示第i组数据；

X=[x⁽¹⁾,x⁽²⁾,……,x^(m)]：表示按列将所有的训练数据集的输入值堆叠成一个矩阵；其中m表示样本数目；

Y=[y⁽¹⁾,y⁽²⁾,……,y^(m)]：表示所有输入数据集对于的输出值，其维度为1×m;

2.2逻辑回归

（1）逻辑回归的输出值是一个概率，算法思想如下：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）激活函数使用sigmoid,它使得输出值限定在0到1之间，符合概率的取值。

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（3）关于偏置项(偏差)b，可将其变成θ₀，对应的x₀恒定为1，如下所示：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.3逻辑回归的代价函数

（1）损失函数（针对单个样本）：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）代价函数（针对全部训练样本）：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

各种损失函数

2.4梯度下降法

（1）下图中左边为凸函数，右边为非凸函数，逻辑回归中代价函数为凸函数，故任意的初始化都能收敛到最优点：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）参数w、b的更新方式：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.5导数

导数即斜率。

2.6跟多的导数例子

记住一些常见的导数求法或者直接查看导数表。

2.7计算图

（1）下图展示计算图计算的过程：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）正向传播用于计算代价函数

2.8计算图的导数计算

（1）反向传播利用链式法则来进行求导，如对a进行求导，其链式法则公式为：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.9逻辑回归中的梯度下降

针对于单个样本

（1）计算图如下：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）首先计算da:

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（3）然后计算dz:

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（4）最后计算dw，db（下面的式子其实已经对所有样本进行的求导）:

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.10m个样本的梯度下降法

（1）以下代码显示了对整个数据集的一次迭代

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）以上过程会有两个循环，一个循环是循环是遍历样本，第二个循环是当w很多时是要循环的，上面之写出了两个w,所以没体现出来。

2.11向量化

（1）使用循环的方式计算：ω^Tx

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）使用向量的方式

吴恩达《深度学习》第一门课（2）神经网络的编程基础

后者不仅书写简单，更重要的是计算速度可以比前者快特别多。

2.12向量化的更多例子

（1）消除w带来的循环

设置u=np.zeros(n(x),1)来定义一个x行的一维向量，从而替代循环，仅仅使用一个向量操作dw=dw+x⁽ⁱ⁾dz⁽ⁱ⁾，最后我们得到dw/m。

2.13向量化逻辑回归

（1）将样本x横向堆叠，形成X，同时根据python的广播性质（把实数b变成了（1，m）维），得到：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）继续利用Python的计算方法，得到A：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.14向量化logistic回归的梯度输出

（1）没有用向量化时使用的代码：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）使用向量化之后的代码：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

其中前面五个式子完成了前向和后向的传播，也实现了对所有训练样本进行预测和求导，再利用后两个式子，梯度下降更新参数。另外如果需要多次迭代的话，还是需要用到一个循环的，那是避免不了的。

2.15Python中的广播

（1）下图形象的总结了Python中的广播

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）在Python的numpy中，axis=0是按照列操作，axis=1,是按照行操作，这一点需要注意。

2.16关于python_numpy向量的说明

（1）使用a=np.random.randn(5)生成的数据结构在python中称为一维数组，它既不是行向量也不是列向量，用a.shape的结果是（5，）这表示它是一个一维向量，a和它的转置相乘其实得到的是一个数。

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）应该使用a=np.random.randn(5，1)这样生成的是一个行向量，它和他的转置乘积会是一个矩阵：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.17Jupyter/iPython Notebooks快速入门

2.18（选修）logistics损失函数的解释

（1）首先需要明确，逻辑回归的输出表示y等于1的概率。故有：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（2）合并成一个式子（要使得式子越大越好）：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（3）根据对数函数log的单调递增性，对上式取对数有：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（4）要最大化上式，最小化上式取反，得到一个样本的损失函数。

（5）所有样本时，认为样本间独立同分布，故联合概率就是每个样本的乘积：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（6）两边取对数得到：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

（7）要最大化上式（最大似然估计）也就是最小化：

吴恩达《深度学习》第一门课（2）神经网络的编程基础

总结一下：为了最小化成本函数J（w,b），我们logistic回归模型的最大似然估计的角度出发，假设训练集中的样本都是独立同分布的条件下。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：吴恩达《深度学习》第一门课（2）神经网络的编程基础 - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

吴恩达《深度学习》第一门课（4）深层神经网络

上一篇 2023年4月11日

吴恩达《深度学习》第一门课（3）浅层神经网络

下一篇 2023年4月11日

【神经网络与深度学习】Caffe训练执行时爆出的Check failed: registry.count(t ype) == 1 (0 vs. 1) Unknown layer type

自己建立一个工程，希望调用libcaffe.lib ，各种配置好，也能成功编译，但是运行就会遇到报错 F0519 14:54:12.494139 14504 layer_factory.hpp:77] Check failed: registry.count(t ype) == 1 (0 vs. 1) Unknown layer type: Input (…

深度学习 2023年4月13日
000
深度学习（十一）残差网络

前言我们都知道增加网络的宽度和深度可以很好的提高网络的性能，深的网络一般都比浅的的网络效果好，比如说一个深的网络A和一个浅的网络B，那A的性能至少都能跟B一样，为什么呢？因为就算我们把A的网络参数全部迁移到B的前面几层，而B后面的层只是做一个等价的映射，就达到了A网络的一样的效果。一个比较好的例子就是VGG，该网络就是在AlexNex的基础上通过增加网络深…

深度学习 2023年4月12日
000
深度学习中得数学，高效计算基础与线性分类器

深度学习说到底就是要调节网络中得权重，使网络的分类结果更接近于训练值。这个重复迭代的过程又是一个线性回归的问题。在这种可能会用到高数，线性代数，概率论中的知识。一、数学基础提一提。 1.高数中得知识。高数中最重要的就是微积分了，那在深度学习中出现最多的一个概念就是梯度。什么是梯度呢?要说导数，学过高数的肯定都知道。其实梯度就是当把标量x变成向量X时，…

深度学习 2023年4月11日
000
深度学习——无监督，自动编码器——尽管自动编码器与 PCA 很相似，but自动编码器既能表征线性变换，也能表征非线性变换；而 PCA 只能执行线性变换

自动编码器是一种有三层的神经网络：输入层、隐藏层（编码层）和解码层。该网络的目的是重构其输入，使其隐藏层学习到该输入的良好表征。自动编码器神经网络是一种无监督机器学习算法，其应用了反向传播，可将目标值设置成与输入值相等。自动编码器的训练目标是将输入复制到输出。在内部，它有一个描述用于表征其输入的代码的隐藏层。自动编码器的目标是学习函数 h(x…

深度学习 2023年4月12日
000
深度学习-激活函数

激活函数 1.Sigmoid激活函数：sigmoid将实值输出压缩在[0,1]范围内，最后输出的结果的平均值更趋近于0.5 （1）sigmoid函数饱和使梯度消失(sigmoidsaturate and kill gradients)。我们从导函数中可以看出sigmoid的导数都是小于0.25的，那么在进行反响传播的时候，梯度相乘结果会慢慢的趋近于0。这样，…

深度学习 2023年4月10日
000
深度学习

深度学习为什么如此受欢迎？都有哪些优点？

本文将从以下三个方面进行分析：什么是深度学习? 深度学习的发展历程都有哪些？深度学习为什么不用支持向量机呢? 什么是支持向量机? 支持向量机(SVM)是一种有监督的机器学习算法，可用于分类或回归问题。它使用一种称为内核技巧的技术来转换数据，然后基于这些转换找到可能输出之间的最佳边界。“核”一词在数学中用来表示加权和或积分的加权函数。支持向量机是一种判别分…

2022年11月10日
100
tensorflow：实战Google深度学习框架第三章 – 南野小童

tensorflow：实战Google深度学习框架第三章 tensorflow的计算模型：计算图–tf.Graph tensorflow的数据模型：张量–tf.Tensor tensorflow的运行模型：会话–tf.Session tensorflow可视化工具：TensorBoard 通过集合管理资源：tf.add_to_collection、tf.g…

深度学习 2023年4月15日
000
斯坦福大学深度学习与自然语言处理第二讲词向量

斯坦福大学深度学习与自然语言处理第二讲：词向量 9条回复斯坦福大学在三月份开设了一门“深度学习与自然语言处理”的课程：CS224d: Deep Learning for Natural Language Processing，授课老师是青年才俊 Richard Socher，以下为相关的课程笔记。第二讲：简单的词向量表示：word2vec, Glove(…

深度学习 2023年4月13日
000

吴恩达《深度学习》第一门课（2）神经网络的编程基础

2.1二分类

2.2逻辑回归

2.3逻辑回归的代价函数

2.4梯度下降法

2.5导数

2.6跟多的导数例子

2.7计算图

2.8计算图的导数计算

2.9逻辑回归中的梯度下降

2.10m个样本的梯度下降法

2.11向量化

2.12向量化的更多例子

2.13向量化逻辑回归

2.14向量化logistic回归的梯度输出

2.15Python中的广播

2.16关于python_numpy向量的说明

2.17Jupyter/iPython Notebooks快速入门

2.18（选修）logistics损失函数的解释

相关文章