机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

2023年4月8日上午11:26 • 循环神经网络

1.循环神经网络的标准模型

前馈神经网络能够用来建立数据之间的映射关系，但是不能用来分析过去信号的时间依赖关系，而且要求输入样本的长度固定
循环神经网络是一种在前馈神经网络中增加了分亏链接的神经网络，能够产生对过去数据的记忆状态，所以可以用于对序列数据的处理，并建立不同时段数据之间的依赖关系
循环神经网络是一类允许节点连接成有向环的人工神经网络。如下图：

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

2.循环神经网络与递归神经网络

从广义上说，递归神经网络可以分为结构递归神经网络和时间递归神经网络
从狭义上说，递归神经网络可以通常就是指结构递归神经网络，而时间递归神经网络则被称为循环神经网络

3.标准循环神经网络的结构类型（两种）

不妨设t时刻，网络的输入向量为x(t),隐含向量为h(t),网络的输出向量是o(t),用V表示输入层与隐含层之间的连接权值，U表示隐含层与隐含层之间的连接权值，W表示隐含层与输出层之间的连接权值，b和a表示隐含层的输出层的偏置

Elman网络：

网络结构如下图：

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

Elman网络包含从隐含节点到上下文节点的反馈链接，以及从上下文节点调到隐含节点的前馈链接，其中上下文节点的输入是隐含层上一时刻的输出
Elman网络从0时刻到T时刻的计算过程可以描述为：

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

Jordan网络：

网络结构如下图：

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

Jordan网络包含从输出节点到上下文节点的反馈，以及从上下文节点到隐含节点的前馈链接，其中上下文节点的输入是输出层上一时刻的输出。此外，Jordan网络的上下文节点允许自连接
Jordan网络从0时刻到T时刻的计算过程可以描述为：

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

4.长短时记忆网络（long short-term memory，LSTM）

长短时记忆网络(LSTM network)，又称为长短时记忆循环网络，是一种在经典循环神经网络的基础上发展起来的改进模型。
LSTM网络的特点在于利用记忆模块代替普通的隐含节点，确保梯度在传递跨越很多时间步骤之后不消失或爆炸，从而能够克服传统循环神经网络训练中遇到的某些困难
长短时记忆网络非常适合于从经验中学习分类，以及处理和预测那些在重要事件之间存在未知时长延迟的时间序列
循环神经网络和长短时记忆网络之间的对应关系如下图所示：

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

5.传统记忆块组成

传统记忆块有一个或者多个具有内部状态的记忆细胞（memory sell）、一个输入挤压单元（input squashing unit）、一个输入门控单元（input gating unit）、一个输入门单元（input gate unit）、一个输出门单元（output gate unit）、一个输出挤压单元（outnput squashing unit）、和一个输出门控单元（output gating unit）几部分组成。

机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习与Tensorflow（5）——循环神经网络、长短时记忆网络 - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

从网络架构方面简析循环神经网络RNN

上一篇 2023年4月8日上午11:25

第十四章——循环神经网络（Recurrent Neural Networks）（第二部分） – royhoo

下一篇 2023年4月8日上午11:26

利用pytorch复现spatial pyramid pooling层

sppnet不讲了，懒得写。。。直接上代码 1 from math import floor, ceil 2 import torch 3 import torch.nn as nn 4 import torch.nn.functional as F 5 6 class SpatialPyramidPooling2d(nn.Module): 7 r”””ap…

PyTorch 2023年4月8日
000
tensorflow–filter、strides

最近还在看《TensorFlow 实战Google深度学习框架第二版》这本书，根据第六章里面对于卷基层和池化层的介绍可以发现，在执行 tf.nn.conv2d 和 tf.nn.max_pool 函数时，有几个参数是差不多的，一个是 filter，在卷积操作中就是卷积核，是一个四维矩阵，格式是 [CONV_SIZE, CONV_SIZE, INPUT_DEEP…

tensorflow 2023年4月6日
000
tensorflow 中的L1和L2正则化

import tensorflow as tf weights = tf.constant([[1.0, -2.0],[-3.0 , 4.0]]) >>> sess.run(tf.contrib.layers.l1_regularizer(0.5)(weights)) 5.0 >>> sess.run(tf.keras.r…

tensorflow 2023年4月8日
000
Keras

Tensorflow2.0与Keras搭建个性化神经网络模型

　　Keras是基于Tensorflow（以前还可以基于别的底层张量库，现在已并入TF）的高层API库。它帮我们实现了一系列经典的神经网络层（全连接层、卷积层、循环层等），以及简洁的迭代模型的接口，让我们能在模型层面写代码，从而不用仔细考虑模型各层张量之间的数据流动。　　但是，当我们有了全新的想法，想要个性化模型层的实现时，仅靠Keras的高层API是不能…

2023年4月8日
000
目标检测

目标检测与目标识别

2020-09-21 Object Recognition: which object is depicted in the image? input: an image containing unknown object(s) Possibly, the position of the object can be marked in the input…

2023年4月6日
000
目标检测（七）YOLOv3: An Incremental Improvement

项目地址 Abstract 该技术报告主要介绍了作者对 YOLOv1 的一系列改进措施（注意：不是对YOLOv2，但是借鉴了YOLOv2中的部分改进措施）。虽然改进后的网络较YOLOv1大一些，但是检测结果更精确，运行速度依然很快。在输入图像分辨率为320*320时，YOLOv3运行耗时22ms，mAP达到28.2，这和SSD一样精确，但是速度比…

目标检测 2023年4月7日
000
CF914G Sum the Fibonacci FWT、子集卷积

传送门一道良心的练习FWT和子集卷积的板子…… 具体来说就是先把所有满足\(s_a \& s_b = 0\)的\(s_a \mid s_b\)的值用子集卷积算出来，将所有\(s_a \oplus s_b\)用xor卷积算出来，把斐波那契数代进去，然后将三个数组and卷积，最后取\(2^i (i \in Z)\)的位置的答案的和 #include&l…

卷积神经网络 2023年4月8日
000
Pytorch加载预训练模型前n层

import torch.nn as nn import torchvision.models as models class resnet(nn.Module): def __init__(self): super(resnet,self).__init__() self.model = models.resnet18(pretrained=True) s…

PyTorch 2023年4月8日
000

合作推广

合作推广

返回顶部