RNN循环神经网络超级大白话

2023年4月7日下午10:13 • 循环神经网络

yizhihongxing

RNN循环神经网络大白话讲解

RNN单元

RNN循环神经网络超级大白话
从上图看，input_data是输入，hidden_layer的输出是h1，从左边来的是初始的隐藏层参数为h0。

神经网络原本的公式也就是输入层X*Wih再经过设定的**函数得到h0。h0乘上Who权重矩阵得到输出层。

h
1
=
t
a
n
h
(
x
∗
W
i
h
)
h1 = tanh(x*W_{ih})
h1=tanh(x∗Wih)

o
u
t
p
u
t
=
h
1
∗
W
h
o
output = h1*W_{ho}
output=h1∗Who

在单个完整的RNN单元中，（不加下一层），有上一层的隐藏层输出参与，因此RNN也就是循环神经网络具有记忆前面的数据的性质，（在RNN中**函数常用tanh)

h
1
=
t
a
n
h
(
x
1
∗
W
i
h
+
h
0
∗
W
h
h
)
h1 = tanh(x_1*W_{ih}+h_0*W_{hh})
h1=tanh(x1∗Wih+h0∗Whh)
对于下一层的h2则会继承一部分h1的内容，而h1又包含h0的内容。以此类推。

h
2
=

t
a
n
h
(
x
2
∗
W
i
h
+
h
1
∗
W
h
h
)
h2 = tanh(x_2*W_{ih}+h_1*W_{hh})
h2=tanh(x2∗Wih+h1∗Whh)

因此在我们进行梯度更新的时候需要计算的权重有三个，分别是
W
i
h
,
W
h
h
,
W
h
o
W_{ih},W_{hh},W_{ho}
Wih,Whh,Who

由于
W
h
h
W_{hh}
Whh在每层的隐藏层输出中会累乘，因此会出现梯度爆炸和梯度消失的现象，这时就需要解决这个问题。因此长短期记忆网络LSTM为了解决梯度消失梯度爆炸的问题被提出，待下一篇讲解LSTM的大白话讲解。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：RNN循环神经网络超级大白话 - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

4.4 高级神经网络结构-什么是 LSTM 循环神经网络

上一篇 2023年4月7日

CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构区别

下一篇 2023年4月7日

keras模块学习之model层【重点学习】

本笔记由博客园-圆柱模板博主整理笔记发布，转载需注明，谢谢合作! model层是keras模块最重要的一个层，所以单独做下笔记，这块比较难理解，本博主自己还在学习这块，还在迷糊中。 model的方法： model.summary() ：打印出模型概况 model.get_config() ：返回包含模型配置信息的Python字典 mod…

Keras 2023年4月5日
000
Ubuntu 远程离线配置 pytorch 运行环境

2019.11.16 为了使用远程的云服务器，必须要自己配置环境，这次还算比较顺利。 1. 安装cuda https://blog.csdn.net/wanzhen4330/article/details/81699769 （安装cuda = nvidia driver + cuda toolkit + cuda samples + others) …

PyTorch 2023年4月7日
000
卷积神经网络

MINST手写数字识别（二）—— 卷积神经网络（CNN）

今天我们的主角是keras，其简洁性和易用性简直出乎David 9我的预期。大家都知道keras是在TensorFlow上又包装了一层，向简洁易用的深度学习又迈出了坚实的一步。所以，今天就来带大家写keras中的Hello World ，做一个手写数字识别的cnn。回顾cnn架构：我们要处理的是这样的灰度像素图：我们先来看…

2023年4月7日
000
卷积神经网络

卷积算法动画演示

https://github.com/vdumoulin/conv_arithmetic [1] Vincent Dumoulin, Francesco Visin – A guide to convolution arithmetic for deep learning (BibTeX) Convolution animations卷积 N.B.: Blu…

2023年4月8日
000
独家 | GAN大盘点，聊聊这些年的生成对抗网络 : LSGAN, WGAN, CGAN, infoGAN, EBGAN, BEGAN, VAE

转自：http://nooverfit.com/wp/%E7%8B%AC%E5%AE%B6%EF%BD%9Cgan%E5%A4%A7%E7%9B%98%E7%82%B9%EF%BC%8C%E8%81%8A%E8%81%8A%E8%BF%99%E4%BA%9B%E5%B9%B4%E7%9A%84%E7%94%9F%E6%88%90%E5%AF%B9%E6%8A…

GAN生成对抗网络 2023年4月7日
000
循环神经网络

神经网络与深度学习（三）：循环神经网络网络

给神经网络增加记忆能力前馈神经网络：相邻两层之间存在单向连接，层内无连接有向无环图输入和输出的维数都是固定的，不能任意改变（全连接前馈网络)无法处理变长的序列数据可计算问题：时延神经网络：时延神经网络(Time Delay Neural Network,TDNN) 建立一个额外的延时单元，用来存储网络的历史信息（可以包括输入、输出、隐状态等)…

2023年4月5日
000
跟我学机器视觉-HALCON学习例程中文详解-QQ摄像头读取条码

跟我学机器视觉-HALCON学习例程中文详解-QQ摄像头读取条码第一步：插入QQ摄像头，安装好驱动（有的可能免驱动）第二步：打开HDevelop，点击助手—打开新的Image Acquisition—选中图像获取接口（I），然后点击检测，找到摄像头。如下图：第三步：点击连接，将颜色空间设置为gray，然后点击实时，此时图像窗口中将显示采集到的图像，将物…

机器学习 2023年4月10日
000
目标检测

ECCV 2020 GigaVision挑战赛“行人和车辆检测”和“多目标追踪”冠军方案解读

点击上方“迈微AI研习社”，选择“星标★”公众号重磅干货，第一时间送达来源丨DeepBlue深兰科技编辑丨迈微AI研习社迈微导读本文介绍了首届GigaVision挑战赛“行人和车辆检测”和“多目标追踪”两个赛道的难点以及冠军方案的工作细节。日前，全球计算机视觉顶会ECCV 2020落下帷幕，各项挑战赛的结果也尘埃落定。深兰科技DeepBlue…

2023年4月8日
000

合作推广

合作推广

返回顶部