TensorFlow（三）循环神经网络

2023年4月8日上午1:22 • 循环神经网络

TensorFlow循环神经网络

为什么有RNN

CNN(卷积神经网络)我们会发现, 他们的输出都是只考虑前一个输入的影响而不考虑其它时刻输入的影响, 比如简单的猫,狗,手写数字等单个物体的识别具有较好的效果. 但是, 对于一些与时间先后有关的, 比如视频的下一时刻的预测,文档前后文内容的预测等, 这些算法的表现就不尽如人意了.因此, RNN就应运而生了

什么是RNN

RNN是一种特殊的神经网络结构, 它是根据"人的认知是基于过往的经验和记忆"这一观点提出的. 它与DNN,CNN不同的是: 它不仅考虑前一时刻的输入,而且赋予了网络对前面的内容的一种’记忆’功能

RNN之所以称为循环神经网路，即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出

RNN主要应用领域

自然语言处理(NLP): 主要有视频处理, 文本生成, 语言模型, 图像处理
机器翻译，机器写小说
语音识别
图像描述生成
文本相似度计算
音乐推荐，商品推荐，视频推荐

RNN模型结构

前面我们说了RNN具有时间"记忆"的功能, 那么它是怎么实现所谓的"记忆"的呢

如图所示, 我们可以看到RNN层级结构较之于CNN来说比较简单, 它主要有输入层,Hidden Layer, 输出层组成.
并且会发现在Hidden Layer 有一个箭头表示数据的循环更新, 这个就是实现时间记忆功能的方法
TensorFlow（三）循环神经网络

RNN展开讨论

TensorFlow（三）循环神经网络
如图2所示为Hidden Layer的层级展开图. t-1, t, t+1表示时间序列. X表示输入的样本. St表示样本在时间t处的的记忆,St = f(WSt-1 +UXt). W表示输入的权重, U表示此刻输入的样本的权重, V表示输出的样本权重

在t =1时刻, 一般初始化输入S0=0, 随机初始化W,U,V, 进行下面的公式计算
TensorFlow（三）循环神经网络
其中,f和g均为**函数. 其中f可以是tanh,relu,sigmoid等**函数，g通常是softmax也可以是其他

时间就向前推进，此时的状态s1作为时刻1的记忆状态将参与下一个时刻的预测活动

以此类推, 可以得到最终的输出值为
TensorFlow（三）循环神经网络

这里的W,U,V在每个时刻都是相等的(权重共享).
隐藏状态可以理解为: S=f(现有的输入+过去记忆总结)

RNN算例

TensorFlow（三）循环神经网络
我们来看输入，共分为两个时刻，其中t0=1,t1=2，输入是如何转换为输出的呢，下面逐步进行分解。

初始时刻，没有上一个隐层的输出，因此初始化为[0,0]。

将上一个隐层的输出与当前时刻输入进行拼接，得到第一个隐藏计算的输入为[0,0,1]。

隐层内计算，将拼接后的输入值与初始权重W进行相乘，同时加上偏置b，得到一个基础值，值得注意的是这个W和b是一个更新的过程，需要不断迭代计算。

第一次**，这次**是对s(t)进行**，采用的**函数为tanh函数，将上一步得到的基础值代入到tanh函数中，得到的输出即为s(t)，这个s(t)将作为下一层的s(t-1)参与下一个隐层的计算。

当前层输出基础值计算，将s(t)和新的权重V相乘加上偏置b，得到当前层输出基础值。

当前层最终输出，加上**函数以后就是当前层的输出啦，此时采用的**函数一般为softmax()。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：TensorFlow（三）循环神经网络 - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

第十讲-循环神经网络–课时23

上一篇 2023年4月8日上午1:22

RNN循环神经网络简介

下一篇 2023年4月8日上午1:23

CNN卷积神经网络_MNIST手写数字识别代码实现

环境：Win8.1 TensorFlow1.0.0 软件：Anaconda3 （集成Python3及开发环境） TensorFlow安装：pip install tensorflow (CPU版) pip install tensorflow-gpu (GPU版) TensorFlow是一个非常强大的用来做大规模数值计算的库。其所擅长的任务之一就是实现以…

卷积神经网络 2023年4月5日
000
机器学习总结-bias–variance tradeoff

bias–variance tradeoff 通过机器学习，我们可以从历史数据学到一个\(f\)，使得对新的数据\(x\)，可以利用学到的\(f\)得到输出值\(f(x)\)。设我们不知道的真实的\(f\)为\(\overline{f}\)，我们从数据中学到的\(f\)为\(f^{*}\)，实际上\(f^{*}\)是\(\overline{f}\)的一个估计…

机器学习 2023年4月11日
000
用Anaconda安装TensorFlow+keras

检测目前安装了哪些环境变量：conda info –envs 查看当前有哪些可以使用的tensorflow版本：conda search –full -name tensorflow 查看tensorflow包信息及依赖关系：conda info tensorflow 在anaconda中安装tensorflow 1. 进入windows命令…

Keras 2023年4月8日
000
PyTorch专栏（八）：微调基于torchvision 0.3的目标检测模型

专栏目录：第一章：PyTorch之简介与下载 PyTorch简介 PyTorch环境搭建第二章：PyTorch之60分钟入门 PyTorch入门 PyTorch自动微分 PyTorch神经网络 PyTorch图像分类器 PyTorch数据并行处理第三章：PyTorch之入门强化数据加载和处理 PyTorch小试牛刀迁移学习混合前端的seq2s…

目标检测 2023年4月7日
000
Keras

keras_基本网络层结构(1)_常用层

参考文献： https://blog.csdn.net/sinat_26917383/article/details/72857454 http://keras-cn.readthedocs.io/en/latest/layers/core_layer/ keras中文文档常用层常用层对应于core模块，core内部定义了一系列常用的网络层，包…

2023年4月7日
000
目标检测中的组件

一、数据增强方式 random erase CutOut MixUp CutMix 色彩、对比度增强旋转、裁剪解决数据不均衡： Focal loss hard negative example mining OHEM S-OHEM GHM（较大关注easy和正常hard样本，较少关注outliners） PISA 二、常用backbone VGG Res…

目标检测 2023年4月6日
000
ChatGPT 时代：阅读会不会被取代？

在这AI 盛行的时代不禁会有人发出疑问，读书对我们来说还有价值吗？本文作者进行了解答并对 2022 年读过的书籍进行了总结和分类，希望能对大家有一定的借鉴意义。文末有留言有礼活动！引言在 AI 和搜索引擎越来越强的时代，所有的知识甚至答案都能信手拈来，人们还有必要读书吗？本文重新反思了读书的意义，认为在 AI 盛行的时代，知识会变得越来廉价，但是知识不…

人工智能概论 2023年5月10日
000
Keras

CNN基础四：监测并控制训练过程的法宝——Keras回调函数和TensorBoard

训练模型时，很多事情一开始都无法预测。比如之前我们为了找出迭代多少轮才能得到最佳验证损失，可能会先迭代100次，迭代完成后画出运行结果，发现在中间就开始过拟合了，于是又重新开始训练。类似的情况很多，于是我们想要实时监测训练动态，并能根据训练情况及时对模型采取一定的措施。Keras中的回调函数和tf的TensorBoard就是为此而生。 Keras回调函数 …

2023年4月8日
000

合作推广

合作推广

返回顶部