一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

2023年4月8日上午3:36 • 循环神经网络

循环神经网络很早就有了，其结构如下图。注意，这里其实只有一个神经网络结构。而不是7个。下图是为了方便表示，一次把7个时间的网络都画在上面。举个翻译的例子，I am hungry 比如在时间1，我们输入了 I，通过神经网络输出了对应的翻译我。然后时间2 ，输入了 am。这个时候网络的输入不但是 am，还有上次 I的隐层的输出。就相当于，网络不但考虑了当前输入，还考虑了以前的输入。

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

如果把神经网络，按照时间倒序 7-1展开的话，就是下面的神经网络结构。其实就相当于一个很深的BP神经网络，所以也会存在前面文章提到的梯度消失的问题。所以传统的RNN，其实能够记住的记忆是固定的而且，不能太长。这是一个很大的缺点。
一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

针对上述RNN的缺点，有人发明了LSTM，可以让一个神经元细胞，有选择的记住或者，忘记某些事情。如下图。主要就是多了三个门。输入门，忘记门，输出门。

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

LSTM的网络结构和工作原理。还拿刚才翻译的例子，I的输入，会影响4和6，

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

Lstm的详细推导参考

http://blog.csdn.net/u010754290/article/details/47167979

这里讲述大体过程。

单个的神经元结构如下:

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

前向传递计算的大体流程,需要严格按照顺序：对应上图。

输入门输出: Yin=y(Zin*Win)
忘记门输出: Yφ=y(Zφ*Wφ)
细胞输入:Sc=g(Wc*Zc)*Yin+Yφ*CEC
输出门输出:Yout=(Zout*Wout)
整个细胞输出:h(Sc)*Yout

误差信号反向传播的计算过程和上述正好相反。

具体计算公式如下：

符号约定:

wij表示从神经元i到j的连接权重(注意这和很多论文的表示是反着的)
神经元的输入用a表示，输出用b表示
下标 ι, φ 和 ω分别表示input gate, forget gate，output gate
c下标表示cell，从cell到 input, forget和output gate的peephole权重分别记做 wcι , wcφ and wcω
Sc表示cell c的状态
控制门的**函数用f表示，g，h分别表示cell的输入输出**函数
I表示输入层的神经元的个数，K是输出层的神经元个数，H是隐层cell的个数

前向传播过程:

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

误差反向传播过程:

一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：一文理解深度学习，卷积神经网络，循环神经网络的脉络和原理4-循环神经网络，LSTM - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

李宏毅机器学习2016 第二十二讲循环神经网络RNN

上一篇 2023年4月8日上午3:35

循环神经网络中如何通过时间反向传播？

下一篇 2023年4月8日上午3:36

循环神经网络

机器学习篇：循环神经网络RNN

0 前言卷积神经网络DNN和CNN 循环神经网络RNN 神经网络发展历史自然语言处理 NLP 循环神经网络想要整理的内容包括：循环神经网络结构经典循环神经网络循环神经网络的变体 1 循环神经网络结构 1.1 循环神经网络神经网络可以当作可以拟合任何函数的盒子，而全连接神经网络存在参数过多的维数灾难，卷积神经网络通过使用卷积核作为特征提取做到了局部…

2023年4月6日
000
[Tensorflow] 使用 tf.keras.utils.get_file() 下载 MS-COCO 2014 数据集

1 import argparse 2 3 import tensorflow as tf 4 tf.enable_eager_execution() 5 6 7 def main(args): 8 “””Download the Microsoft COCO 2014 data set.””” 9 # Annotation zip 10 tf.keras.…

Keras 2023年4月6日
000
目标检测

目标检测-SSD算法从零实现

1. 几个工具函数 def box_corner_to_center(boxes): “””从（左上，右下）转换到（中间，宽度，高度）””” x1, y1, x2, y2 = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3] cx = (x1 + x2) / 2 cy = (y1 + y2) / 2 w =…

2023年4月5日
000
卷积神经网络

CNN中卷积层池化层反向传播

参考：https://blog.csdn.net/kyang624823/article/details/78633897 卷积层池化层反向传播： 1，CNN的前向传播 a）对于卷积层，卷积核与输入矩阵对应位置求积再求和，作为输出矩阵对应位置的值。如果输入矩阵inputX为M*N大小，卷积核为a*b大小，那么输出Y为（M-a+1）*（N-b+1）大小。 …

2023年4月8日
000
目标检测

制作目标检测数据集

前言制作目标检测的数据集有很多，个人认为labelImg最为好用，但是有时下载的版本会出现一些小问题。现将labelImg安装包存放在百度云盘里，有需要的可自行下载，亲测好用。链接：https://pan.baidu.com/s/11z8scI2IFXVRuxfTtg-xtA提取码：432w 使用方法 1、下载解压后有一个文件夹“data”,进入该文件夹击…

2023年4月8日
000
使用TensorFlow对图像进行随机旋转的实现示例

https://www.jb51.net/article/178934.htm在使用深度学习对图像进行训练时，对图像进行随机旋转有助于提升模型泛化能力。然而之前在做旋转等预处理工作时，都是先对图像进行旋转后保存到本地，然后再输入模型进行训练，这样的过程会增加工作量，如果图片数量较多，生成旋转的图像会占用更多的空间。直接在训练过程中便对图像进行随机旋转，可有效…

tensorflow 2023年4月7日
000
TensorFlow 安装报错的解决办法

最近关注了几个python相关的公众号，没事随便翻翻，几天前发现了一个人工智能公开课，闲着没事，点击了报名。几天都没有音信，我本以为像我这种大龄转行的不会被审核通过，没想到昨天来了审核通过的电话，通知提前做好准备。所谓听课的准备，就是笔记本一台，装好python、tensorflow的环境。赶紧找出尘封好几年的联想笔记本，按照课程给的流程安装。将期间遇…

tensorflow 2023年4月8日
000
循环神经网络

如何实现模拟人类视觉注意力的循环神经网络？

我们观察PPT的时候，面对整个场景，不会一下子处理全部场景信息，而会有选择地分配注意力，每次关注不同的区域，然后将信息整合来得到整个的视觉印象，进而指导后面的眼球运动。将感兴趣的东西放在视野中心，每次只处理视野中的部分，忽略视野外区域，这样做最大的好处是降低了任务的复杂度。深度学习领域中，处理一张大图的时候，使用卷积神经网络的计算量随着图片像素的增加而线性…

2023年4月8日
000

合作推广

合作推广

返回顶部