Keras lstm 文本分类示例

2023年4月8日上午1:11 • Keras

#基于IMDB数据集的简单文本分类任务

#一层embedding层+一层lstm层+一层全连接层

#基于Keras 2.1.1 Tensorflow 1.4.0

代码：

 1 '''Trains an LSTM model on the IMDB sentiment classification task.
 2 The dataset is actually too small for LSTM to be of any advantage
 3 compared to simpler, much faster methods such as TF-IDF + LogReg.
 4 # Notes
 5 - RNNs are tricky. Choice of batch size is important,
 6 choice of loss and optimizer is critical, etc.
 7 Some configurations won't converge.
 8 - LSTM loss decrease patterns during training can be quite different
 9 from what you see with CNNs/MLPs/etc.
10 '''
11 from __future__ import print_function
12 
13 from keras.preprocessing import sequence
14 from keras.models import Sequential
15 from keras.layers import Dense, Embedding
16 from keras.layers import LSTM
17 from keras.datasets import imdb
18 
19 max_features = 20000
20 maxlen = 80  # cut texts after this number of words (among top max_features most common words)
21 batch_size = 32
22 
23 print('Loading data...')
24 (x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
25 print(len(x_train), 'train sequences')
26 print(len(x_test), 'test sequences')
27 
28 print('Pad sequences (samples x time)')
29 x_train = sequence.pad_sequences(x_train, maxlen=maxlen)
30 x_test = sequence.pad_sequences(x_test, maxlen=maxlen)
31 print('x_train shape:', x_train.shape)
32 print('x_test shape:', x_test.shape)
33 
34 print('Build model...')    
35 model = Sequential()
36 model.add(Embedding(max_features, 128))
37 model.add(LSTM(128, dropout=0.2, recurrent_dropout=0.2))
38 model.add(Dense(1, activation='sigmoid'))
39 model.summary()
40 
41 # try using different optimizers and different optimizer configs
42 model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
43 
44 print('Train...')
45 model.fit(x_train, y_train,batch_size=batch_size,epochs=15,validation_data=(x_test, y_test))
46 score, acc = model.evaluate(x_test, y_test,batch_size=batch_size)
47 print('Test score:', score)
48 print('Test accuracy:', acc)

结果：

Test accuracy: 0.81248

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Keras lstm 文本分类示例 - Python技术站

Keras 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

主流机器学习[xgb, lgb, Keras, LR]

上一篇 2023年4月8日

【tensorflow】tf.keras + Sequential() 6 步搭建神经网络

下一篇 2023年4月8日

tensorflow

tensorflow2.0 squeeze出错

用tf.keras写了自定义层，但在调用自定义层的时候总是报错，找了好久才发现问题所在，所以记下此问题。问题代码 u=tf.squeeze(tf.expand_dims(tf.expand_dims(inputs,axis=1),axis=3)@self.kernel,axis=3) 其中inputs的第一维为None，这里的代码为自定义的前向传播。我是想…

2023年4月8日
000
循环神经网络

第一章循环神经网络简介

1）简单介绍我们知道在机器学习领域中，传统的神经网络模型是从输入层到隐藏层再到输出层，层与层之间是全连接的，而每层之间的节点是无连接的，它的弊端我在这里就不再赘述。我们主要介绍RNN，他为什么称为循环神经网络呢？因为它的每一个输出序列都与前面的输出序列有关。具体表现在该网络会记录前面的信息并应用到当前输出的计算中，也就是说各隐藏层之间是有连接的，它的模型如…

2023年4月8日
000
【udacity】机器学习-波士顿房价预测小结

Evernote Export 机器学习的运行步骤 1.导入数据没什么注意的，成功导入数据集就可以了，打印看下数据的标准格式就行用个info和describe 2.分析数据这里要详细分析数据的内容，看看缺省值和数据的特征，主要是为了看到数据的特征，并且人肉分析一下特征值对目标值的大约影响，嗯，就是这样然后开始划分数据，将数据分为两个部分，一个数据的特征值…

机器学习 2023年4月10日
000
[PyTorch] torch.squeee 和 torch.unsqueeze()

torch.squeeze torch.squeeze(input, dim=None, out=None) → Tensor 分为两种情况: 不指定维度或指定维度不指定维度 input: (A, B, 1, C, 1, D) output: (A, B, C, D) Example >>> x = torch.zeros(2, 1,…

PyTorch 2023年4月8日
000
keras遇到bert实战一（bert实现分类）

说明：最近一直在做关系抽取的任务，此次仅仅是记录一个实用的简单示例参考https://www.cnblogs.com/jclian91/p/12301056.html 参考https://blog.csdn.net/asialee_bird/article/details/102747435 import pandas as pd import codec…

Keras 2023年4月8日
000
卷积神经网络

卷积神经网络参数计算及卷积层输出尺寸计算

一、卷积神经网络参数计算 CNN一个牛逼的地方就在于通过感受野和权值共享减少了神经网络需要训练的参数的个数，所谓权值共享就是同一个Feature Map中神经元权值共享，该Feature Map中的所有神经元使用同一个权值。因此参数个数与神经元的个数无关，只与卷积核的大小及Feature Map的个数相关。但是共有多少个连接个数就与神经元的个数相关了，神经元…

2023年4月8日
001
机器学习基石6-泛化理论

注：文章中所有的图片均来自台湾大学林轩田《机器学习基石》课程。笔记原作者：红色石头微信公众号：AI有道上一节课，主要探讨了\(M\)的数值大小对机器学习的影响。如果\(M\)很大，那么就不能保证机器学习有很好的泛化能力，所以问题转换为验证\(M\)有限，最好是按照多项式成长。然后通过引入了成长函数\(m_H(N)\)和dichotomy以及break po…

机器学习 2023年4月10日
000
卷积神经网络

深度拾遗(06) – 1X1卷积/global average pooling

什么是1X1卷积 11的卷积就是对上一层的多个feature channels线性叠加，channel加权平均。只不过这个组合系数恰好可以看成是一个11的卷积。这种表示的好处是，完全可以回到模型中其他常见N*N的框架下，不用定义新的层。比如上一层通过100个卷积核得到了 W * H * 100的数据，进行10个1X1卷积后得到 W * H * 10 的数据，…

2023年4月6日
000

合作推广

合作推广

返回顶部