keras基础-优化策略：mini-batch gradient decent

2023年4月6日下午4:48 • Keras

yizhihongxing

参考《Keras中文文档》http://keras-cn.readthedocs.io/en/latest/

相关概念：神经网络优化器（优化策略）、梯度下降、随机梯度下降、小批的梯度下降（mini-batch gradient decent）、batch_size

batch

这个概念与Keras无关，老实讲不应该出现在这里的，但是因为它频繁出现，而且不了解这个技术的话看函数说明会很头痛，这里还是简单说一下。

深度学习的优化算法，说白了就是梯度下降。每次的参数更新有两种方式。

第一种，标准梯度下降。遍历全部数据集算一次损失函数，然后算函数对各个参数的梯度，更新梯度。这种方法每更新一次参数都要把数据集里的所有样本都看一遍，计算量开销大，计算速度慢，不支持在线学习，这称为Batch gradient descent，批梯度下降。

另一种，每看一个数据就算一下损失函数，然后求梯度更新参数，这个称为随机梯度下降，stochastic gradient descent。这个方法速度比较快，但是收敛性能不太好，可能在最优点附近晃来晃去，hit不到最优点。两次参数的更新也有可能互相抵消掉，造成目标函数震荡的比较剧烈。

为了克服两种方法的缺点，现在一般采用的是一种折中手段，mini-batch gradient decent，小批的梯度下降，这种方法把数据分为若干个批，按批来更新参数，这样，一个批中的一组数据共同决定了本次梯度的方向，下降起来就不容易跑偏，减少了随机性。另一方面因为批的样本数与整个数据集相比小了很多，计算量也不是很大。

基本上现在的梯度下降都是基于mini-batch的，所以Keras的模块中经常会出现batch_size，就是指这个。

顺便说一句，Keras中用的优化器SGD是stochastic gradient descent的缩写，但不代表是一个样本就更新一回，还是基于mini-batch的。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：keras基础-优化策略：mini-batch gradient decent - Python技术站

Keras 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch和tensorflow的爱恨情仇之一元线性回归例子（keras插足啦）

上一篇 2023年4月6日

keras和tensorflow保存为可部署的pb格式

下一篇 2023年4月6日

pytorch seq2seq模型中加入teacher_forcing机制

在循环内加的teacher forcing机制，这种为目标确定的时候，可以这样加。目标不确定，需要在循环外加。 decoder.py 中的修改 “”” 实现解码器 “”” import torch.nn as nn import config import torch import torch.nn.functional as F import numpy…

PyTorch 2023年4月8日
000
循环神经网络

小常识10: 循环神经网络（RNN）与长短时记忆网络LSTM简介。

小常识10: 循环神经网络（RNN）与长短时记忆网络LSTM简介。本文目的：在计算机视觉(CV)中，CNN 通过局部连接／权值共享／池化操作／多层次结构逐层自动的提取特征，适应于处理如图片类的网格化数据。在自然语言处理(NLP)中，循环神经网络被设计用于处理序列的神经网络，如应用 RNN 在语音识别，语言建模，翻译等。同时，现有的计算机视觉研究开始结…

2023年4月8日
000
Python 最简实现逻辑回归，针对二维数据进行机器学习

话不多说，直接上代码 1 ”’ 2 logistic regression 3 ”’ 4 5 #导入需要的包 6 import pandas as pd 7 #建立数据集 8 from collections import OrderedDict 9 #是否通过考试用0和1表示，0表示未通过，1表示通过。 10 examDict={‘学习时间’:[0.5…

机器学习 2023年4月16日
000
卷积神经网络

CNN之经典卷积网络框架原理

一、GoogleNet 1、原理介绍 inception 结构　　如下图所示，输入数据经过一分四，然后做一些大小不同的卷积，之后再堆叠feature map 　　　　 inception结构可以理解为把一个输入数据先通过一个1*1的卷积核进行降维然后再通过四个卷积核（分别为1*1，3*3，5*5，maxpooling）进行升维运…

2023年4月8日
000
循环神经网络

循环神经网络与LSTM网络 – kexinxin

循环神经网络与LSTM网络循环神经网络与LSTM网络循环神经网络RNN 循环神经网络广泛地应用在序列数据上面，如自然语言，语音和其他的序列数据上。序列数据是有很强的次序关系，比如自然语言。通过深度学习关于序列数据的算法要比两年前的算法有了很大的提升。由此诞生了很多有趣的应用，比如语音识别，音乐合成，聊天机器人，机器翻译，自然语言理解和其他的一些应…

2023年4月5日
000
Tensorflow–池化操作

pool(池化)操作与卷积运算类似，取输入张量的每一个位置的矩形邻域内值的最大值或平均值作为该位置的输出值，如果取的是最大值，则称为最大值池化；如果取的是平均值，则称为平均值池化。pooling操作在图像处理中的应用类似于均值平滑，形态学处理，下采样等操作，与卷积类似，池化也分为same池化和valid池化一.same池化 same池化的操作方式一般有两种…

tensorflow 2023年4月6日
000
ubuntu16.04 使用tensorflow object detection训练自己的模型

一、构建自己的数据集 1、格式必须为jpg、jpeg或png。 2、在models/research/object_detection文件夹下创建images文件夹，在images文件夹下创建train和val两个文件夹，分别存放训练集图片和测试集图片。 3、下载labelImg目标检测标注工具（1）下载地址：https://github.com/tzut…

tensorflow 2023年4月8日
000
利用机器学习预测房价

以下是关于“利用机器学习预测房价”的完整攻略，其中包含两个示例说明。示例1：使用 Python 和 scikit-learn 库预测房价步骤1：导入必要库在使用 Python 和 scikit-learn 库预测房价之前，我们需要导入一些必要的库，包括numpy和sklearn。 import numpy as np from sklearn.data…

Keras 2023年5月16日
000

合作推广

合作推广

返回顶部