循环神经网络模型RNN

2023年4月7日下午10:33 • 循环神经网络

学习序列模型rnn实现从X到Y的映射。

最简单的NN模型，将九个输入变量输出9个0或1的结果。

但是这样不好，因为输入输出长度不一定相同。

单纯的神经网络并不能分享从不同位置学到的特征。如识别不同位置的人名。

RNN

读到第二个单词时候不是只通过当前的词x<2>就预测出y<2> 的，

也会输入一些来自时间步（time-step）1的信息。时间步1的**值就会传递到时间步2。

循环神经网络模型RNN

one-hot向量~如上

输入下一个单词x<3>，rnn试图预测y<3>。

rnn传递一个**值到下一个时间步用于计算。

初始化a<0>有很多方法。如赋值为0。

循环神经网络模型RNN

循环神经网络模型RNN （一些文章中这样表示循环神经网络但是没有上面展开的图清晰）

每一步使用相同的参数w_ax，

**值，也就是水平参数，是由参数w_aa决定的，

每一个time-step使用相同的w_aa。

每一个输出由w_ya决定。

rnn的缺点是只用到了当前预测节点之前的输入的信息。位于其之后的输入信息都没有被利用。

循环神经网络模型RNN

某一时刻的预测没有使用序列后部分的信息。可以使用双向循环神经网络(BRNNs)解决这个问题。

整洁版rnn:

循环神经网络模型RNN

首先输入零向量a0。为了计算a1，使用**函数g

rnn使用的**函数经常是tanh，reLU也会用但前者更常用。

使用何种**函数取决与问题种类。

二分类：sigmoid

k类别分类：softmax

命名体识别（输出是0或1）：sigmoid

计算a<1>、y<1>标准式

循环神经网络模型RNN

通用计算公式：

循环神经网络模型RNN

简化符号：循环神经网络模型RNN

把waa,wax合并成一个矩阵。

如waa是100x100，wax是100x10000

所以wa是100x10100的矩阵。

循环神经网络模型RNN

a<t-1>与x<t>竖着摞起来。

循环神经网络模型RNN

总体：

循环神经网络模型RNN

正确。

重写输出y<t>的表达式：循环神经网络模型RNN

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：循环神经网络模型RNN - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

TensorFlow 使用预训练好的卷积神经网络和循环神经网络（lstm）模型处理图片转文字（im2txt）

上一篇 2023年4月7日

第六讲循环神经网络 –SimpleRNN_onehot_1pre1

下一篇 2023年4月7日

tensorflow

Tensorflow&CNN：验证集预测与模型评价

https://blog.csdn.net/sc2079/article/details/90480140 　　本科毕业设计终于告一段落了。特写博客记录做毕业设计（路面裂纹识别）期间的踩过的坑和收获。希望对你有用。　　目前有：　　　　1.Tensorflow&CNN：裂纹分类　　　　2.Tensorflow&CNN：验证集预测与模型评价…

2023年4月8日
000
使用caffe测试自己的图片

第一种方法是测试批量图片，使用caffe.bin即可，首先要做的是把你的jpg图片转换为LMDB的格式，如何转换呢？用/build/tools/convert_image –resize_width 227 –resize_height 227 图片所在的目录 class.txt LMDB文件生成的目录（注意是目录）即可，这里class.txt…

Caffe 2023年4月6日
000
Keras

keras中TimeDistributed的用法

TimeDistributed这个层还是比较难理解的。事实上通过这个层我们可以实现从二维像三维的过渡，甚至通过这个层的包装，我们可以实现图像分类视频分类的转化。考虑一批32个样本，其中每个样本是一个由16个维度组成的10个向量的序列。该层的批输入形状然后(32, 10, 16)。可以这么理解，输入数据是一个特征方程，X1+X2+…+X10=Y，从矩阵…

2023年4月8日
000
Spark-数据源及机器学习算法部署

1、数据源读取使用的时候，需要加载驱动 –jars 或者添加到classpath中或scaddjar Spark对Oracle数据库读取，代码如下： conf = SparkConf().setAppName(string_test)sc = SparkContext(conf=conf) ctx = SQLContext(sc)sqltext = “…

机器学习 2023年4月10日
000
《从机器学习到深度学习》笔记（1）有监督学习

有监督学习（Supervised Learning）是指这样的一种场景：有一组数量较多的历史样本集，其中每个样本有一组特征（features）和一个或几个标示其自身的类型或数值的标签（label）；对历史样本学习得到模型后，可以用新样本的特征预测其对应的标签。 1. 场景在有监督学习中可以将每条数据看成是一条由特征到标签的映射，训练的目的是找出映射的规律…

机器学习 2023年4月12日
000
大数据关键技术：常规机器学习方法

机器学习方法简介机器学习、人工智能、深度学习是什么关系？机器学习研究和构建的是一种特殊算法（而非某一个特定的算法），能够让计算机自己在数据中学习从而进行预测。 Arthur Samuel给出的定义指出，机器学习是这样的领域，它赋予计算机学习的能力（这种学习能力）不是通过显著式编程获得的。不管是机器学习还是深度学习，都属于人工智能（AI）的范畴。所以人工…

机器学习 2023年4月11日
000
图像处理

Stable Diffusion img2img图生图高级教程：换脸、换服装、换背景、换风格案例精讲

Stable Diffusion 图生图功能是Stable Diffusion中一个强大的图像生成和编辑功能，它能够通过随机过程将一张图像转换为另一张具有不同风格和特征的图像。在本篇Stable Diffusion 图生图教学中，我将带领你探索这一强大的图像生成和编辑技术。img2img图改图功能以其高质量的图像生成、风格转换和编辑能力受到广泛关…

2023年7月25日
001
白话机器学习的数学笔记系列8代码实现_一元回归

先发这几个吧，其他的等有空再编辑好发出来…欢迎大家指出我的错误哈~

机器学习 2023年4月12日
000

合作推广

合作推广

返回顶部