[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

2023年4月8日上午9:30 • 循环神经网络

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

PDF	VIDEO

Recurrent Neural Network

Example Application

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

slot 安装、放入、沟槽、插入…… 哇好多意思啊。
Slot Filling 就相当把关键字提溜出来放到相应的凹槽内，强迫症患者真舒服。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

那么怎样将一个词表示成一个向量呢？方法有很多：

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

但是上述方法有个问题，有时候有的词汇不在词典中，这时候用other 或者开头字母来表示他们，这就是Byund 1-of-N encoding。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

好了，现在可以将表示出来的vector丢到一个network里，希望它输出一个几率。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

但是这样也不能解决所有问题，比如一下两句话输入的vector是一样的，但很明显表达的意思却完全相反。
这时，就希望我们的neural network 是有记忆里的，能记住 arrive ／leave ，能理解上下文。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

那么这个有记忆里的NN就是RNN。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

Example

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

在我们使用memory时，必须要给它初始值，比如0，这样network的单元就多了一个接收数据来源。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

这样，即使是相同的输入，输出也可能是不一样的。
所以也代表，在RNN中，是对输入顺序敏感的，也就是调换input的顺序，得到的输出是不同的。
所以，如果我们要用RNN来解决Slot Filling 这个问题如下。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

需要注意的是，上图中并不是有三个network ，而是同一个network被使用了三次。
这样，RNN就能在同一个台北的输入下得到不同的输出

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

当然，network是有很大拓展性的，比如也可使是deep 的。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

RNN也有不同的变形，Jordan Network 存的就是output的值。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

Bidirectional RNN，RNN还可以是双向的，本来我们是从句首读到句尾，但其方向是可以反过来的，如果同时train相反方向的network输出都丢给output layer，这样的好处就是，RNN前后都过了一遍视野比较广。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

Long Short-term Memory (LSTM)

刚刚的memory是很单纯的存储的，现在还有一种Long Short-term Memory (LSTM)。
其实是给memory加了两扇IO闸门，什么时候外界可以IO memory，还有一层Forget Gate来决定什么时候擦除memory的值，以上门的开闭都是由network自己来学的。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

这个memory的具体结构如下，c’就是新存入memory中的值。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

Long Short-term Memory (LSTM) Example

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

其中每一个input x1、x2、x3需要乘的weight和加上的bais都是network学的。

那么这个NN与我们原来所认识的NN有什么不同呢？
原来，会有很多neural 我们会把input乘上不同的weight当作每一个neural的输入，然后每一个neural都是一个function，然而LSTM的memory cell想成是一个neural 就好了。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

就比如说有的机器需要插一个电源就可以动，而LSTM需要四个插电源才能动，四个电源是不同的，参数量是原来的四倍。
假设现在有一整排的memory,每个memory存的scalar是 C^t-1 vector中的一个维度。intput x 时，通过transform，Z^f 、Z^I 、 Z 、Z^o分别负责一种门。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

提出一个memory，分析一下计算过程。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

c是存的值。
而且还加上一步，它会把上一个时间点的hidden layer输出值，和上一个时间点的memory都接到它的输入，也就是每一个时间点的input将由三部门组成，如下图。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

当然L一般不会一层，会叠五六层，就是Multiple-layer LSTM，现在通常所说的LSTM就是指这种。

[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)

Don’t worry if you cannot understand this. Keras can handle it
Keras supports “LSTM”, “GRU”, “Simp”

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：[机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1) - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

动手学深度学习第十二课：循环神经网络

上一篇 2023年4月8日上午9:28

神经网络基础-循环神经网络

下一篇 2023年4月8日上午9:30

循环神经网络

十一，基于循环神经网络的时序数据聚类算法及其并行化

论文名称基于循环神经网络的时序数据聚类算法及其并行化，王国瑞. 研究对象主要围绕时序数据聚类问题，不同于已有的时序数据聚类方法，本文献的研究是基于循环神经网络的时序数据聚类方法，研究成果可用于金融股票数据分析。研究动机在时间序列数据挖掘领域，结合循环神经网络将其应用在时间序列数据预测及聚类任务上。文献综述基于时间临近度的时序聚类：主要在于序列相似性的衡…

2023年4月6日
000
卷积神经网络–padding

1. 当padding 为VALID时：输出宽和高的公式代码为： output_width = (input_width – filter_width + 1) / strides_width; (结果向上取整) output_height = (input…

卷积神经网络 2023年4月6日
000
tensorflow

tensorflow学习笔记四：mnist实例–用简单的神经网络来训练和测试

刚开始学习tf时，我们从简单的地方开始。卷积神经网络（CNN）是由简单的神经网络（NN）发展而来的，因此，我们的第一个例子，就从神经网络开始。神经网络没有卷积功能，只有简单的三层：输入层，隐藏层和输出层。数据从输入层输入，在隐藏层进行加权变换，最后在输出层进行输出。输出的时候，我们可以使用softmax回归，输出属于每个类别的概率值。借用极客学院的图表示…

2023年4月8日
000
一个发现图像里卷积的作用—-平移算子

在当今深度学习火热的今天，图像处理的卷积算子必不可少。可是卷积算子的含义是什么呢？在图像检测里，通常要考虑平移，缩放，旋转。那么这些操作是怎么通过卷积实现的呢。仅仅把网络当成函数拟合器是不够的。今天发现特定的卷积算子就是平移操作！以下以原图像padding一个像素宽度，灰度为0。对平移算子写出来： 1 0 0 0 0 0 0 0 0 …

卷积神经网络 2023年4月5日
000
循环神经网络

第十四章——循环神经网络（Recurrent Neural Networks）（第一部分）

第十四章——循环神经网络（Recurrent Neural Networks）（第一部分）由于本章过长，分为两个部分，这是第一部分。这几年提到RNN，一般指Recurrent Neural Networks，至于翻译成循环神经网络还是递归神经网络都可以。wiki上面把Recurrent Neural Networks叫做时间递归神经网络，与之对应的还有一…

2023年4月8日
000
目标检测

【机器学习】传统目标检测算法之DPM

前面介绍了一下HOG，HOG有一个缺点：很难处理遮挡问题，人体姿势动作幅度过大或物体方向改变也不易检测。继2005年HOG提出之后，DPM模型在借鉴了HOG之后也被提了出来同时还取得了不错的成绩。 DPM概述 DPM（Deformable Part Model），正如其名称所述，可变形的组件模型，是一种基于组件的检测算法，其所见即其意。该模型由大神Felz…

2023年4月8日
000
机器学习小结：SVM

　　第一次接触SVM（支持向量机）还是四年前的事情了，那时用它做手写体数字识别，参考了一些书和文献，照着人家的步骤用Matlab敲出了PCA+SVM的代码，识别率一般，90都没上，不好意思跟人打招呼。最囧的是，后来参加一个面试，人家问我神马是支持向量，我都答不上来。上了研究生，在各种模式识别和机器学习相关的课上，反复学习了这一经典算法，每次都有新的体会。借此…

机器学习 2023年4月12日
000
循环神经网络

吴恩达深度学习笔记——循环神经网络（RNN）

目录一、为什么使用序列模型（Why sequence models）二、数学符号（Notation）三、循环神经网络（Recurrent neural network）四、通过时间的反向传播（Backpropagation through time）五、不同类型的循环神经网络（Different types of RNNs）六、语言模型和序列生成…

2023年4月6日
000

合作推广

合作推广

返回顶部