深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)—-非常经典

2023年4月8日上午12:36 • 循环神经网络

1.RNN的典型应用

(1)机器翻译,序列到序列(自然语言处理，NLP)

(2)看图说话，就是描述图片的内容。

2.RNN的应用背景

RNN与CNN最大的不同就是引入了记忆的概念，就是输出依赖输入和记忆。

3.RNN的结构

注意：St公式中的U和W表示权重矩阵，Ot公式中的V也是权重矩阵。

RNN结构补充说明：

4.双向RNN

注意：,分别表示从左往右的结果，和从右往左的结果，然后这两个结果做拼接。

5.RNN与BPTT算法

由于s2是关于W的函数，所以s3对W求偏导必须往前追溯(复合函数求导)

6.LSTM应用背景

7. LSTM的结构理解

(1)ct-1为输入，ct为输出

(2)几个关键门与操作

<1>忘记门

<2>细胞状态更新准备

上图中，it是一个[0,1]之间的概率P,Ct表示Xt时刻所获取的信息(可以形象的理解为六年级一年学习的知识)

Ct可以理解为当年学习的所有的知识，it表示把当年学习的所有知识Ct进行过滤的概率向量，实现将Ct中的新知识添加到以前的记忆中(即对六年级的知识有选择的添加到记忆中)。

<3>更新细胞状态

上图中的Ct公式参数说明：

ft表示旧信息的通过率，Ct-1表示旧信息的所有内容，it新增信息的筛选器，Ct表示新增的所有信息。

<4>获取输出

8.LSTM的几种变体

阅读剩余 58%

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习笔记11-循环神经网络(RNN)和长短时记忆(LSTM)—-非常经典 - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

动手学深度学习——循环神经网络

上一篇 2023年4月8日上午12:35

基于注意力模型和卷积循环神经网络的中文自然场景文本识别

下一篇 2023年4月8日上午12:36

pytorch（一）张量基础及通用操作

1.pytorch主要的包： torch: 最顶层包及张量库 torch.nn: 子包，包括模型及建立神经网络的可拓展类 torch.autograd: 支持所有微分操作的函数子包 torch.nn.functional: 其他所有函数功能，包括激活函数，卷积操作，构建损失函数等 torch.optim: 所有的优化器包，包括adam，sgd等 torch.…

PyTorch 2023年4月8日
000
机器学习总结-LR（对数几率回归）

LR（对数几率回归）函数为\(y=f(x)=\frac{1}{1+e^{-(w^{T}x+b)}}\)。由于输出的是概率值\(p(y=1|x)=\frac{e^{w^{T}x+b}}{1+e^{w^{T}x+b}},p(y=0|x)=\frac{1}{1+e^{w^{T}x+b}}\)，所以求解使用极大似然估计来求解参数\(w,b\)。为了方便表示，记\…

机器学习 2023年4月11日
000
【原创】机器学习算法原理与实践-决策树（文章迁移）

文章迁移说明：此文已由lightinglei于2019-02-15发布，是本人的另外一个账号，现同步迁移至本账号 1、决策树的定义决策树是一种基本分类与回归的方法，本文主要讲述的是分类的决策树，决策树模型呈树型结构，如下图1所示，决策树主要由节点和有向边组成，节点主要分为内部结点和叶节点，内部节点表示一个特征或属性，内部节点包括：根节点、父节点、子节点，…

机器学习 2023年4月12日
000
Keras读取保存的模型时, 产生错误[ValueError: Unknown activation function:relu6]

Solution: from keras.utils.generic_utils import CustomObjectScope with CustomObjectScope({‘relu6′: keras.applications.mobilenet.relu6,’DepthwiseConv2D’: keras.applications.mobilene…

Keras 2023年4月8日
000
机器学习

【机器学习】李宏毅——Explainable ML(可解释性的机器学习)

本文介绍了Explainable ML(可解释性的机器学习)的相关内容，抱愧这项技术的相关概述、当前发展等等。在前面的学习之中，我们已经学习了很多的模型，它能够针对特定的任务，接受我们的输入并产生目标的输出。但我们并不满足于此，我们甚至希望机器告诉我们，它是如何得到这个答案的，而这就是可解释的机器学习。 Why we need Explainable ML…

2023年4月17日
000
GAN相关：PAN（Perceptual Adversarial Network）/ 感知对抗网络

GAN相关：PAN（Perceptual Adversarial Network）/ 感知对抗网络 Perceptual Adversarial Networks for Image-to-Image Transformation Chaoyue Wang et al intro 首先介绍pixel-wise的图像任务。指出用传统的l1和l2 norm来进行…

GAN生成对抗网络 2023年4月7日
000
卷积神经网络

Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2

http://blog.csdn.net/sunbow0 第三章Convolution Neural Network (卷积神经网络) 2基础及源代码解析 2.1 Convolution Neural Network卷积神经网络基础知识 1）基础知识：自行google,百度。基础方面的非常多，随便看看就能够，仅仅是非常多没有把细节说得清楚和明确；能把细节…

2023年4月6日
000
Keras

keras—多层感知器MLP—IMDb情感分析

1 import urllib.request 2 import os 3 import tarfile 4 from keras.datasets import imdb 5 from keras.preprocessing import sequence 6 from keras.preprocessing.text import Tokenizer 7…

2023年4月5日
000

合作推广

合作推广

返回顶部