深度学习：循环神经网络（RNN）的变体LSTM、GRU

2023年4月8日上午10:41 • 循环神经网络

假设我们试着去预测“I grew up in France… I speak fluent French”最后的词French。当前的信息建议下一个词可能是一种语言的名字，但是如果我们需要弄清楚是什么语言，我们是需要先前提到的离当前位置很远的 France 的上下文的。这说明相关信息和当前预测位置之间的间隔就肯定变得相当的大。

不幸的是，在这个间隔不断增大时，RNN 会丧失学习到连接如此远的信息的能力。

LSTM

Long Short-Term Memory—— 一般就叫做 LSTM，是一种 RNN特殊的类型，可以学习长期依赖信息。

LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为，而非需要付出很大代价才能获得的能力！

深度学习：循环神经网络（RNN）的变体LSTM、GRU

忘记门，在我们 LSTM 中的第一步是决定我们会从细胞状态中丢弃什么信息。这个决定通过一个称为忘记门层完成。（eg. 一句话中，当我们看到新的主语，我们希望忘记旧的主语。）
输入门，确定什么样的新信息被存放在细胞状态中。
输出门，实际去执行——丢弃掉我们确定需要丢弃的信息，更新需要更新的信息。

GRU

Gated Recurrent Unit——一般叫做GRU，作为LSTM的一种变体，通过分析LSTM架构中哪些部分是真正需要的，进行了改进，将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态，加诸其他一些改动。最终的模型比标准的 LSTM 模型要简单，也是非常流行的变体。

深度学习：循环神经网络（RNN）的变体LSTM、GRU

复位门，控制当前状态中哪些部分用于计算下一个目标状态。
更新门，在极端情况下，可以选择全部复制或者完全替换。

复位和更新门能独立地“忽略”状态向量的一部分。

References:
[1] [译] 理解 LSTM 网络
[2] 王亮老师《深度学习》讲义

©qingdujun
2018-6-9 于北京怀柔

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习：循环神经网络（RNN）的变体LSTM、GRU - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

双向循环神经网络(BiRNN)

上一篇 2023年4月8日上午10:41

循环神经网络(RNN)简介

下一篇 2023年4月8日上午10:55

利用docker在window7下安装TensorFlow

安装过程下碰了不少坑，记录一下安装过程，方便以后有需要时复用。 1、安装docker 下载最新版本的docker并且默认安装即可，安装后打开Docker Quickstart Terminal，初次进去需要一段时间。下载网址：https://www.docker.com/products/docker-toolbox 2、拉取本地镜像 docker…

tensorflow 2023年4月8日
000
卷积神经网络

卷积神经网络物体检测之感受野大小计算

　　学习RCNN系列论文时，出现了感受野(receptive field)的名词，感受野的尺寸大小是如何计算的，在网上没有搜到特别详细的介绍，为了加深印象，记录下自己对这一感念的理解，希望对理解基于CNN的物体检测过程有所帮助。　　在卷积神经网络中，感受野的定义是卷积神经网络每一层输出的特征图（feature map）上的像素点在原始图像上映射的区…

2023年4月8日
000
pytorch（二十一）：交叉验证

一、K折交叉验证将训练集分成K份，一份做验证集，其他做测试集。这K份都有机会做验证集二、代码 1 import torch 2 import torch.nn as nn 3 import torchvision 4 from torchvision import datasets,transforms 5 from torch.…

PyTorch 2023年4月7日
000
Pytorch结合PyG实现MLP过程详解

下面是关于Pytorch结合PyG实现MLP的完整攻略。解决方案在Pytorch中，可以结合PyG实现MLP。以下是Pytorch结合PyG实现MLP的详细步骤：步骤一：导入库首先需要导入Pytorch和PyG库。 import torch import torch.nn.functional as F from torch_geometric.nn…

循环神经网络 2023年5月16日
000
keras多层感知机MLP

肯定有人要说什么多层感知机，不就是几个隐藏层连接在一起的吗。话是这么说，但是我觉得我们首先要自己承认自己高级，不然怎么去说服（hu nong）别人呢 from keras.models import Sequential from keras.layers import Dense import numpy as np #设置随机种子，使得每次结果都…

Keras 2023年4月7日
000
tensorflow

使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错：’utf-8′ codec can’t decode byte 0xcc in position 78: invalid continuation byte

使用 Visual Studio 2015 + Python3.6 + tensorflow 构建神经网络时报错：’utf-8′ codec can’t decode byte 0xcc in position 78: invalid continuation byte 如下：首先考虑的是文件路径是否是中文路径，检查之后发现无论python…

2023年4月6日
000
动手学pytorch-优化算法

优化算法 1.Momentum 2.AdaGrad 3.RMSProp 4.AdaDelta 5.Adam 1.Momentum 目标函数有关自变量的梯度代表了目标函数在自变量当前位置下降最快的方向。因此，梯度下降也叫作最陡下降（steepest descent）。在每次迭代中，梯度下降根据自变量当前位置，沿着当前位置的梯度更新自变量。然而，如果自变量的迭代…

PyTorch 2023年4月7日
000
目标检测

caffe框架下目标检测——faster-rcnn实战篇问题集锦

1、问题解决方案：没编译好，需要在lib下编译make 需要在caffe-fast-rcnn下编译make或者make all -j16 ,还需要make pycaffe 2、问题解决方案：/py-faster-rcnn/lib# make all -j16 3、问题解决方案：下载faster_rcnn_models.tgz到py…

2023年4月8日
000

合作推广

合作推广

返回顶部