循环神经网络（Recurrent Neural Network, RNN）

2023年4月6日上午8:35 • 循环神经网络

总结自吴恩达老师的网易深度学习工程师微专业

1. 前向传播

循环神经网络（Recurrent Neural Network, RNN）
$a^{t}=g^{(a)}(W_{aa}a^{<t-1>}+W_{ax}x^{<t>}+b_a)$
$hat y^{<t>}=g^{(y)}(W_{ya}a^{<t>}+b_y)$
or, 简化版
$a^{t}=g^{(a)}(W_a[a^{<t-1>}, x^{<t>}]+b_a)$
$hat y^{<t>}=g^{(y)}(W_ya^{<t>}+b_y)$

Note

一般而言，初始**向量为： $a^{<0>}=vec0$
通常， $g^{(a)}$ 选择 $tanh$ 函数（ $tanh$ 函数梯度消失的问题会用其他方式解决），有时也会选用 $relu$ 函数。
$hat y^{<t>}=g^{(y)}(W_{ya}a^{<t>}+b_y)$ 如果是二分类问题，使用 $sigmoid$ 函数，如果是多分类问题，可以使用 $softmax$ 函数。

2. 损失函数

为了进行反向传播计算，使用梯度下降等方法来更新RNN的参数，我们需要定义一个损失函数，如下：
$L(hat y,y)=sum^{T_y}_{t=1}L^{<t>}(hat y^{<t>},y^{<t>})=sum^{T_y}_{t=1}-(y^{<t>}log(hat y^{<t>})+(1-y^{<t>})log(1-hat y^{<t>}))$

3. BPTT

RNN的反向传播将在后续部分有专门的介绍。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：循环神经网络（Recurrent Neural Network, RNN） - Python技术站

人工智能循环神经网络

0 0 打赏

微信扫一扫

支付宝扫一扫

第四周：循环神经网络RNN

上一篇 2023年4月6日上午8:35

Recurrent Neural Networks(RNN) 循环神经网络初探

下一篇 2023年4月6日上午8:37

卷积神经网络

1×1卷积核理解

1*1的卷积核在NIN、Googlenet中被广泛使用，但其到底有什么作用也是一直困扰的问题，这里总结和归纳下在网上查到的自认为很合理的一些答案，包括1）跨通道的特征整合2）特征通道的升维和降维 3）减少卷积核参数（简化模型）　　在我学习吴恩达老师Deeplearning.ai深度学习课程的时候，老师在第四讲卷积神经网络第二周深度卷积网络：实例探究的…

2023年4月8日
000
Caffe

Caffe学习三模型使用和特征提取

模型使用使用caffe训练得到的模型进行测试，一般需要如下文件：1.训练好的caffemodel模型此处使用lenet_iter_10000.caffemodel。 2.测试网络deploy 可以对lenet_train_test.prototxt做修改。主要修改的地方包括输入数据，最后的top，权值初始化，第一个卷积层名称不能和训练网络conv1同名…

2023年4月8日
000
全卷积网络（FCN）实战：使用FCN实现语义分割

摘要：FCN对图像进行像素级的分类，从而解决了语义级别的图像分割问题。本文分享自华为云社区《全卷积网络（FCN）实战：使用FCN实现语义分割》，作者： AI浩。 FCN对图像进行像素级的分类，从而解决了语义级别的图像分割（semantic segmentation）问题。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类（全联接层＋sof…

卷积神经网络 2023年4月7日
000
Anomaly Detection Python机器学习笔记异常点检测算法——Isolation Forest Python机器学习笔记——One Class SVM PAC在异常检测中的应用异常检测: 应用多元高斯分布进行异常检测

数据集中的异常数据通常被成为异常点、离群点或孤立点等，典型特征是这些数据的特征或规则与大多数数据不一致，呈现出“异常”的特点，而检测这些数据的方法被称为异常检测。　　异常数据根据原始数据集的不同可以分为离群点检测和新奇检测：离群点检测(Outlier Detection) 　　大多数情况我们定义的异常数据都属于离群点检测，对这些数据训练完之…

机器学习 2023年4月13日
000
《python机器学习—预测分析核心算法》：构建预测模型的一般流程

参见原书1.5节构建预测模型的一般流程问题的日常语言表述->问题的数学语言重述重述问题、提取特征、训练算法、评估算法熟悉不同算法的输入数据结构：1.提取或组合预测所需的特征2.设定训练目标3.训练模型4.评估模型在训练数据上的性能表现机器学习：开发一个可以实际部署的模型的全部过程，包括对机器学习算法的理解和实际的操作通常，有非常切实的原因，导…

机器学习 2023年4月11日
000
机器学习笔记—-最小二乘法，局部加权，岭回归讲解

前情提要：关于logistic regression，其实本来这章我是不想说的，但是刚看到岭回归了，我感觉还是有必要来说一下。一:最小二乘法最小二乘法的基本思想：基于均方误差最小化来进行模型求解的方法。在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的欧氏距离之和最小。就是说让你现在追一个女生，你希望女生喜欢你是f(xi),而女生喜欢你的…

机器学习 2023年4月12日
000
目标检测

目标检测：fast-rcnn学习上

R-CNN非常缓慢，因为通过 Selective search得到的2000个目标区域，再进入CNN网络中2000次运算需要大量的时间。SPP-Net试图解决这个问题（对特征提取部分的升级，也要得到2K的候选框，但不是以前2K个候选框逐个提取特征）。使用SPP-net（空间金字塔池化网络），先对一整张图进行一次卷积得到整张图的卷积特征。然后卷积特征中找到对…

2023年4月8日
000
GAN生成对抗网络

生成对抗网络——GAN（一）

转自：https://blog.csdn.net/leviopku/article/details/81292192 Generative adversarial network据有关媒体统计：CVPR2018的论文里，有三分之一的论文与GAN有关由此可见，GAN在视觉领域的未来多年内，将是一片沃土(CVer们是时候入门GAN了)。而发现这片矿源的就是GAN…

2023年4月6日
000

循环神经网络（Recurrent Neural Network, RNN）

1. 前向传播

2. 损失函数

3. BPTT

相关文章