深度学习与神经网络（八）——循环神经网络RNN

2023年4月8日上午4:06 • 循环神经网络

理解循环神经网络RNN的作用

首先看一个简单案例，在某宝的好评/差评检测中，系统要能够分析用户的评价是好评还是差评，那怎样处理这样的评价数据呢，例如有一条评价“I hate this boring movie”

机器怎样解决这样的问题呢

首先我们在之前的时间序列表示中已经知道了怎样对一个单词进行表示。如果使用glove的话，整句话会表示成一个[5,100]的tensor

（100是glove规定的）

我们最简单的方式是，将这个100维的tensor和一个线性层相连接来提取其特征

通过线性层最后汇总起来生成一个值，用于判断其二分类是好的评论还是差的

但这种方式有明显的缺陷

①如果句子的单词过长，或者是小说这样的，那么需要的[w,b]参数量就会非常大

②更为致命的是，我们人类说话是由上下语境信息的，上一句话说的什么，下一句话说的什么，需要联合起来做一个语句的推断。比如“我不喜欢你”，如果只是看到喜欢的话还以为是喜欢呢，所以肯定不能一个单词一个单词得去分析。所以我们相当于是需要一个consistent memory

改用权值共享的方式

这是使用了卷积神经网络的weigth sharing的思路，所有单词的[w,b]都是相同的，来尝试减少网络的参数量

这代表着我这个线性层的抽取特征的能力是针对于所有单词的

这在一定程度上解决了长句子参数量过大的问题

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习与神经网络（八）——循环神经网络RNN - Python技术站

人工智能循环神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

循环神经网络RNN与LSTM

上一篇 2023年4月8日上午4:06

6、循环神经网络

下一篇 2023年4月8日上午4:06

循环神经网络

自然语言处理之循环神经网络

1. RNN基础循环神经网络RNN,是一类用于处理序列数据的神经网络。就像卷积网络是专门用于处理网格化数据的神经网络，循环神经网络是专门用于处理序列x(1),…,xTx^{(1)},dots,x^{T}x(1),…,xT的神经网络。正如卷积网络可以很容易地扩展到具有很大宽度的高度的图像，以及处理大小可变的图像，循环网络可以扩展到更长的序列，大多数循环网…

2023年4月8日
000
目标检测

目标检测的图像特征提取之LBP特征

LBP（Local Binary Pattern，局部二值模式）是一种用来描述图像局部纹理特征的算子；它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen,和 D. Harwood 在1994年提出，用于纹理特征提取。而且，提取的特征是图像的局部的纹理特征； 1、LBP特征的描述原始的LBP算子定义为在33的窗…

2023年4月8日
000
Andrew Ng机器学习算法入门((七):特征选择和多项式回归

特征选择还是回归到房价的问题。在最开始的问题中，我们假设房价与房屋面积有关，那么最开始对房价预测的时候，回归方程可能如下所示：其中frontage表示的房子的长，depth表示的是房子的宽。但长和宽显然不是用于预测房价的一个很好的特征，正常的特征应该是房屋面积，那么正常的线性方程应该为：其中X表示的房屋面积。所以选择了合适的特征，对算法进行预测和分类…

机器学习 2023年4月11日
000
Tensorflow安装使用一段时间后，import时出现错误：ImportError: DLL load failed

解决方法：更新pillow pillow是python中的一个图像处理库，是anaconda中自带的。但可能因为pillow的版本较老，所以需要更新一下。 conda uninstall pillow conda update pip pip install pillow 不知道为何这个包跟tensorflow有冲突。。。更新后，无报错。

tensorflow 2023年4月8日
000
循环神经网络

循环神经网络：RNN（Recurrent Neural Network）

一、普通RNN 最简单的RNN网络可以看成，在全连接网络的基础上，在每一层网络中增加一个将自己层的输出连接到在自己层的输入，如下图：对整个网络的计算方式与传统的神经网络略有不同。损…

2023年4月8日
000
机器学习(公式推导与代码实现)–sklearn机器学习库

一.scikit-learn概述 1.sklearn模型 sklearn全称是scikit-learn，它是一个基于Python的机器学习类库，主要建立在NumPy、Pandas、SciPy和Matplotlib等类库之上，基本上覆盖了常见了分类、回归、聚类、降维、模型选择和预处理模块。 2.sklearn源码下图是sklearn在GitHub上的源代…

机器学习 2023年4月11日
000
python大战机器学习——支持向量机

　　支持向量机（Support Vector Machine，SVM）的基本模型是定义在特征空间上间隔最大的线性分类器。它是一种二类分类模型，当采用了核技巧之后，支持向量机可以用于非线性分类。　　1）线性可分支持向量机（也称硬间隔支持向量机）：当训练数据线性可分是，通过硬间隔最大化，学得一个线性可分支持向量机　　2）线性支持向量机（也称为软间隔支持向量机…

机器学习 2023年4月13日
000
深度学习

（实战篇）用Python识别手写数字

我们使用 Scikit-learn 库实现一个简单的深度学习训练示例，训练目标为：识别手写数字。以下是实现手写数字识别的完整示例代码： from sklearn import datasets from sklearn import svm from sklearn.model_selection import train_test_split from …

2023年2月15日
000

合作推广

合作推广

返回顶部