1.RNN的典型应用

(1)机器翻译,序列到序列(自然语言处理,NLP)

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

 

(2)看图说话,就是描述图片的内容。

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

2.RNN的应用背景

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

 

RNN与CNN最大的不同就是引入了记忆的概念,就是输出依赖输入和记忆。

3.RNN的结构

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

 

注意:St公式中的U和W表示权重矩阵,Ot公式中的V也是权重矩阵。

RNN结构补充说明:

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

4.双向RNN

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

注意:深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典,分别表示从左往右的结果,和从右往左的结果,然后这两个结果做拼接。

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

5.RNN与BPTT算法

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

 

由于s2是关于W的函数,所以s3对W求偏导必须往前追溯(复合函数求导)

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

6.LSTM应用背景

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

7. LSTM的结构理解

(1)ct-1为输入,ct为输出

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

(2)几个关键门与操作

<1>忘记门

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

<2>细胞状态更新准备

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

上图中,it是一个[0,1]之间的概率P,Ct表示Xt时刻所获取的信息(可以形象的理解为六年级一年学习的知识)

Ct可以理解为当年学习的所有的知识,it表示把当年学习的所有知识Ct进行过滤的概率向量,实现将Ct中的新知识添加到以前的记忆中(即对六年级的知识有选择的添加到记忆中)。

<3>更新细胞状态

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

上图中的Ct公式参数说明:

ft表示旧信息的通过率,Ct-1表示旧信息的所有内容,it新增信息的筛选器,Ct表示新增的所有信息。

<4>获取输出

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

8.LSTM的几种变体

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典

深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)----非常经典