Pytorch深度学习——循环神经网络RNN

2023年4月8日上午10:58 • 循环神经网络

循环神经网络RNN

RNN是一类用于处理序列数据的神经网络，在深度学习方面，图像识别、语音识别主要运用卷积神经网络（CNN），而文字语言处理主要运用循环神经网络（RNN）。

语言模型

语言模型（language model）是自然语言处理的重要技术，可用于提升语音识别和机器翻译的性能。自然语言处理中最常见的数据是文本数据。

例如，在语音识别中，给定一段“厨房里食油用完了”的语音，有可能会输出“厨房里食油用完了”和“厨房里石油用完了”这两个读音完全一样的文本序列。如果语言模型判断出前者的概率大于后者的概率，我们就可以根据相同读音的语音输出“厨房里食油用完了”的文本序列。

假设一段长度为TT的文本中的词依次为 $w_1,w_2,…,w_T$ 那么在离散的时间序列中， $w_t$ 可看作在时间步(time step)的输出或标签。给定一个长度为T的词的序列 $w_1,w_2,…,w_T$
语言模型将计算该序列的概率：

亦即词 $w_1,w_2,…,w_T$ 组合输出一个文本的概率 Pytorch深度学习——循环神经网络RNN

语言模型的计算

例如，假设序列 $w_1,w_2,…,w_T$ 中的每个次是一次生成的，则一段含有4个词的文本序列的概率为： Pytorch深度学习——循环神经网络RNN

$n$ 元语法

当序列长度增加时，计算和存储多个词共同出现的概率的复杂度会呈指数级增加。 $n$ 元语法通过马尔可夫假设（虽然并不一定成立）简化了语言模型的计算。这里的马尔可夫假设是指一个词的出现只与前面nn个词相关，即 $n$ 阶马尔可夫链（Markov chain of order $n$ ）。
如果基于 $n−1$ 阶马尔可夫链，我们可以将语言模型改写为
Pytorch深度学习——循环神经网络RNN

RNN

Pytorch深度学习——循环神经网络RNN

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Pytorch深度学习——循环神经网络RNN - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

1.11 双向循环神经网络-深度学习第五课《序列模型》-Stanford吴恩达教授

上一篇 2023年4月8日上午10:58

循环神经网络中的LSTM和GRU

下一篇 2023年4月8日上午10:58

【零基础学会LTE】【4】LTE 36.212 咬尾卷积码译码

//本文均属原创，转载请注明出处。 //本课程以36.212 v10.4.0为教材，请自行到3GPP网站下载。 //由于保密的原因，暂不提供代码查看。模块作用：对咬尾卷积码进行译码。相关模块：咬尾卷积码编码，阅读本节之前请阅读编码节。模块优缺点：适用范围：对应章节：本节主要介绍咬尾卷积码的译码，关于咬尾卷积码的译码方法很多，这里我只介绍最…

卷积神经网络 2023年4月6日
000
Keras

keras 学习笔记（一） ——— model.fit & model.fit_generator

from keras.preprocessing.image import load_img, img_to_array a = load_img(‘1.jpg’) b = img_to_array(a) print (type(a),type(b)) 输出：　　a type:<class ‘PIL.JpegImagePlugin.JpegImageF…

2023年4月8日
000
Keras

keras各种优化方法总结 SGDmomentumnesterov

http://blog.csdn.net/luo123n/article/details/48239963 前言这里讨论的优化问题指的是，给定目标函数f(x)，我们需要找到一组参数x，使得f(x)的值最小。本文以下内容假设读者已经了解机器学习基本知识，和梯度下降的原理。 SGD SGD指stochastic gradient descent，即随…

2023年4月7日
000
PyTorch

基于pytorch框架的手写数字识别(mnist数据集)

前段时间开始学习pytorch，学习了一点pytorch的小语法，在网上找到了pytorch入门写CNN的代码，自己尝试读懂加上注释。更多的了解一下pytorch，代码注释写的还算清楚，在阅读代码之前可以看一下我收获的知识都是在代码里遇到的不会的语句，我自己通过阅读别博客获取的知识，大多数都是torch在读取数据的操作。先读一下这个有利于阅读代码。收获的知…

2023年4月8日
000
PyTorch

pytorch快速加载预训练模型参数的方式

针对的预训练模型是通用的模型，也可以是自定义模型，大多是vgg16 , resnet50 , resnet101 , 等，从官网加载太慢直接修改源码，改为本地地址 1.直接使用默认程序里的下载方式，往往比较慢； 2.通过修改源代码，使得模型加载已经下载好的参数，修改地方如下：通过查找自己代码里所调用网络的类，使用pycharm自带的函数查找功能（ctr…

2023年4月7日
000
【TensorFlow-windows】(五) CNN（卷积神经网络）对cifar10的识别

主要内容： 1.基于CNN的cifar10识别（详细代码注释） 2.该实现中的函数总结平台： 1.windows 10 64位 2.Anaconda3-4.2.0-Windows-x86_64.exe （当时TF还不支持python3.6，又懒得在高版本的anaconda下配置多个Python环境，于是装了一个3-4.2.0（默认装python3.5），建…

卷积神经网络 2023年4月8日
000
目标检测

目标检测框架｜又一新框架来袭，关系网络用于目标检测（文末附源码）

目标检测框架｜又一新框架来袭，关系网络用于目标检测（文末附源码）原创 Edison_G 计算机视觉研究院今天广告 21个项目玩转深度学习：基于TensorFlow的实践详解(博文视点出品) 作者：何之源京东目标检测导读目前大部分的目标检测算法都是独立地检测图像中的目标，如果模型能学到目标之间的关系显然对于检测效果提升会有很大的帮助，因…

2023年4月8日
000
卷积神经网络

信号卷积（线性卷积）

从数学上讲，卷积就是一种运算。定义函数 $f,g$ 的卷积 $(f * g)(t)$ 如下 1. 连续形式： $$(f*g)(t) = int_{-infty}^{+infty}f(tau)g(t – tau)dtau$$ 那这个怎么理解呢？函数 $g(t)$ 可以理解为冲击响应，即一个冲击信号经过一个线性系统后产生的输出函数，假设它的图像长成…

2023年4月5日
000

合作推广

合作推广

返回顶部