猪猪的机器学习笔记（二十）循环神经网络

2023年4月5日下午10:22 • 循环神经网络

循环神经网络

作者：樱花猪

摘要：

本文为七月算法（julyedu.com）12月机器学习第二十次课在线笔记。 多层反馈RNN（Recurrent neural Network、循环神经网络）神经网络是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。不同于前馈神经网络的是，RNN可以利用它内部的记忆来处理任意时序的输入序列，这让它可以更容易处理如不分段的手写识别、语音识别等。

引言：

循环神经网络的目的使用来处理序列数据。在传统的神经网络模型中，是从输入层到隐含层再到输出层，层与层之间是全连接的，每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。RNN之所以称为循环神经网路，即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。理论上，RNNs能够对任何长度的序列数据进行处理。但是在实践中，为了降低复杂性往往假设当前的状态只与前面的几个状态相关。

本次课程比较注重于实践，

预备知识：

人工神经网络

一、状态和模型

猪猪的机器学习笔记（二十）循环神经网络

IID数据：分类问题、回归问题、特征表达。

大部分数据都不满足IID：序列分析、序列生成、内容提取。

1、序列样本

猪猪的机器学习笔记（二十）循环神经网络

序列样本多种多样，可以一对一、一对多和多对多等。

RNN不仅仅能够处理序列输出，同时也能够得到序列输出，因此我们可以说RNN学习出来的是程序而不是函数。

2、序列预测：

输入：时间变化向量序列：猪猪的机器学习笔记（二十）循环神经网络

在t时刻通过模型来估计：猪猪的机器学习笔记（二十）循环神经网络

序列预测存在的问题：

A. 对内部状态难以建模和观察

B. 对长时间范围的场景（context）难以建模和观察

解决方案：引入内部隐含状态变量

3、序列预测模型：

猪猪的机器学习笔记（二十）循环神经网络

输入离散列序列：猪猪的机器学习笔记（二十）循环神经网络

在时间t的更新计算：猪猪的机器学习笔记（二十）循环神经网络

预测计算：猪猪的机器学习笔记（二十）循环神经网络

整个计算过程中，W保持不变，猪猪的机器学习笔记（二十）循环神经网络在0时刻初始化

二、RNN训练

猪猪的机器学习笔记（二十）循环神经网络

前向计算，相同W矩阵需要乘以多次；多步之前的输入x会影响当前的输出；在后向计算的时候，同样相同的矩阵也会乘以多次。

1、BPTT算法（BackProp Through Time）

RNN前向计算

猪猪的机器学习笔记（二十）循环神经网络

计算W的偏导，把所有的Time Step加起来

猪猪的机器学习笔记（二十）循环神经网络

应用链式规则

猪猪的机器学习笔记（二十）循环神经网络

2、LSTM（Long Short Term Memory）Cell

猪猪的机器学习笔记（二十）循环神经网络

是一种应用最为广泛、成功的RNN方案。

可以长期保持某个状态，cell state值通过forget gate控制实现保留多少“老”的状态

Layer把输入维度x变成输出维度h。

参考文献

http://blog.csdn.net/heyongluoyao8/article/details/48636251

来自为知笔记(Wiz)

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：猪猪的机器学习笔记（二十）循环神经网络 - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

TensorFlow框架(6)之RNN循环神经网络详解

上一篇 2023年4月5日下午10:22

关于RNN (循环神经网络）相邻采样为什么在每次迭代之前都需要将参数detach

下一篇 2023年4月5日下午10:22

caffe Python API 之中值转换

#　编写一个函数，将二进制的均值转换为python的均值 def convert_mean(binMean,npyMean): blob = caffe.proto.caffe_pb2.BlobProto() bin_mean = open(binMean, ‘rb’ ).read() blob.ParseFromString(bin_mean) arr =…

Caffe 2023年4月8日
000
Keras

keras中TimeDistributed的用法

TimeDistributed这个层还是比较难理解的。事实上通过这个层我们可以实现从二维像三维的过渡，甚至通过这个层的包装，我们可以实现图像分类视频分类的转化。考虑一批32个样本，其中每个样本是一个由16个维度组成的10个向量的序列。该层的批输入形状然后(32, 10, 16)。可以这么理解，输入数据是一个特征方程，X1+X2+…+X10=Y，从矩阵…

2023年4月8日
000
卷积神经网络

1-10 卷积神经网络示例

卷积神经网络示例（Convolutional neural network example）假设，有一张大小为 32×32×3 的输入图片，这是一张 RGB 模式的图片，你想做手写体数字识别。 32×32×3 的 RGB 图片中含有某个数字，比如 7，你想识别它是从 0-9 这 10 个字中的哪一个，我们构建一个神经网络来实现这个功能。输入是 32×3…

2023年4月8日
000
目标检测

目标检测 | 经典算法 Cascade R-CNN: Delving into High Quality Object Detection

作者从detector的overfitting at training/quality mismatch at inference问题入手，提出了基于multi-stage的Cascade R-CNN，该网络结构清晰，效果显著，并且能简单移植到其它detector中，带来2-4%的性能提升论文: Cascade R-CNN: Delving into Hi…

2023年4月6日
000
keras模块学习之model层【重点学习】

本笔记由博客园-圆柱模板博主整理笔记发布，转载需注明，谢谢合作! model层是keras模块最重要的一个层，所以单独做下笔记，这块比较难理解，本博主自己还在学习这块，还在迷糊中。 model的方法： model.summary() ：打印出模型概况 model.get_config() ：返回包含模型配置信息的Python字典 mod…

Keras 2023年4月5日
000
循环神经网络

第3章循环神经网络（RNN与LSTM）——3.5 循环神经网络模型（双向RNN）

一、举例 1.明天早上第一节课是英语课，所以明天早上我应该带一本_______书。可以通过前面的预测后面的，如题。但是不能通过后面的预测前面的，建议使用双向循环神经网络。二、双向循环神经网络从左到右，和从右到左，都是同步进行的。（1）每个时刻有两个隐藏层（2）一个从左到右，一个从右到左（3）向前和向后传播参数独立 w0*w1*…

2023年4月8日
000
tensorflow

ubuntu安装Anaconda2-4.4.0+TensorFlow

1、下载Anaconda 到官网http://continuum.io/downloads下载anaconda。 2、安装anaconda 在终端输入:cd ~/Downloads; bash Anaconda-2.2.0-linux-x86_64.sh 3、加入环境变量最后会询问是否把anaconda的bin添加到用户的环境变量中，选择y…

2023年4月8日
000
深度之眼PyTorch训练营第二期 —5、Dataloader与Dataset 以及 transforms与normalize

一、人民币二分类描述：输入人民币，通过模型判定类别并输出。数据：四个子模块　　　　数据收集 -> img,label 原始数据和标签　　　　数据划分 -> train训练集 valid验证集 test测试集　　　　数据读取 -> DataLoader ->(1)Sampler(生成index) (2)Dataset(读取…

PyTorch 2023年4月8日
000

合作推广

合作推广

返回顶部