深度学习中的batch_size、epoch和iterations

2023年4月13日下午9:31 • 深度学习

在进行模型训练的时候经常会遇到这三个参数：batch_size、epoch和iterations，那么它们之间的关系是怎样的呢？

首先，产生的原因主要是：

1. 原本的大批量梯度下降训练时，每次要处理完所有数据才更新梯度和损失值，需要的时间太长，计算开销大。

2. 但是呢，每次计算一个数据，就更新一次损失值和梯度值，虽然速度快，但是不容易收敛，而且不一定找到全局最优解。

于是，就出现了折中方法 —— 小批量梯度下降策略，所以就有了这些概念。

batch_size：指的是每批次的大小，即每个iteration送入神经网络的样本量，也就是每个batch包含的样本量。

iterations：指的是迭代次数，也就是每处理完所有数据一次，需要多少次迭代，每一个batch_size的数据，完成一次训练过程，叫做完成了一次迭代(iteration)。

epoch：一个epoch指的是，将所有数据送入神经网络，完成一次整体的前向计算和反向传播的过程。

通俗一点说：如果我们有10000个样本，分为4个batch，

那么batch_size值就是：10000/4=2500；

iterations值就是：4；

全体数据被计算一次，就完成了一次epoch。

##

参考：

https://www.jianshu.com/p/e5076a56946c/

https://blog.csdn.net/nini_coded/article/details/79250703

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习中的batch_size、epoch和iterations - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

深度学习原理与框架-神经网络-线性回归与神经网络的效果对比 1.np.c_[将数据进行合并] 2.np.linspace(将数据拆成n等分) 3.np.meshgrid(将一维数据表示为二维的维度) 4.plt.contourf(画出等高线图，画算法边界)

上一篇 2023年4月13日

【深度学习笔记】第 4 课：模型性能评估

下一篇 2023年4月13日

深度学习

吴恩达 — 神经网络与深度学习 — L1W3练习

第三周 – 浅层神经网络第 21 题以下哪项是正确的？（选出所有正确项） A.\(a^{[2](12)}\)是第12层，第2个训练数据的激活向量 B.\(X\)是一个矩阵，其中每个列是一个训练数据 C.\(a^{[2]}_4\)是第2层，第4个训练数据的激活输出 D.\(a^{[2]}_4\)是第2层，第4个神经元的激活输出 E.\(a^{[2]}\)表…

2023年4月10日
000
吴恩达《深度学习》第二门课（3）超参数调试、Batch正则化和程序框架

3.1调试处理（1）不同超参数调试的优先级是不一样的，如下图中的一些超参数，首先最重要的应该是学习率α（红色圈出），然后是Momentum算法的β、隐藏层单元数、mini-batch size（黄色圈出）、再之后是Layer、learning rate decay（紫色圈出）、最后是Adam算法中的β1、β2、ε。（2）用随机取值代替网格点取值。下图左边…

深度学习 2023年4月11日
000
PGL图学习之基于GNN模型新冠疫苗任务[系列九]

本项目讲了论文节点分类任务和新冠疫苗任务，并在论文节点分类任务中对代码进行详细讲解。PGL八九系列的项目耦合性比较大，也花了挺久时间研究希望对大家有帮助。 PGL图学习之基于GNN模型新冠疫苗任务[系列九] 项目链接：https://aistudio.baidu.com/aistudio/projectdetail/5123296?contributionT…

深度学习 2023年4月13日
000
深度学习多机多卡解决方案-purine

未经允许请不要转载，原作者：zhxfl，http://www.cnblogs.com/zhxfl/p/5287644.html 目录：一、简介二、环境配置三、运行demo 四、硬件配置建议五、其他一、简介深度学习多机多卡集群已经成为主流，相对于caffe和mxnet这两个比较活跃的开源，purine显得更值得在高校的学生细读，因为purine…

深度学习 2023年4月10日
000
实战Google深度学习框架-C3-TensorFlow入门

第三章：TensorFlow入门 TensorFlow存在计算模型，数据模型和运算模型（本文用TF代表TensorFlow） 3.1 计算模型-计算图　3.1.1 计算图的概念　　TensorFlow这个词Tensor表示张量，可以简单的理解为多维数组，Flow直观的表达了张量之间通过计算相互转化的过程。　　如上图，TensorFlow中每个节点都是一…

深度学习 2023年4月12日
000
深度学习

Python深度学习读书笔记-2.初识神经网络

MNIST 数据集包含60 000 张训练图像和10 000 张测试图像，由美国国家标准与技术研究院（National Institute of Standards and Technology，即MNIST 中的NIST）在20 世纪80 年代收集得到。类和标签在机器学习中，分类问题中的某个类别叫作类（class）。数据点叫作样本（sample…

2023年4月10日
000
深度学习

Ubuntu16.04搭建深度学习框架——TensorFlow

TensorFlow是一个采用数据流图（data flow graphs），用于数值计算的开源软件库,说白了，就是一个库。小编自己在Ubuntu搭建了深度学习框架TensorFlow，感觉挺简单，现在总结如下。 1.安装Anaconda 在ubuntu系统版本的Anaconda3已经集成了3.6版本的Python，安装步骤如下： a.下载Anoconda3…

2023年4月10日
000
带你了解NLP的词嵌入

摘要：今天带领大家学习自然语言处理中的词嵌入的内容。本文分享自华为云社区《【MindSpore易点通】深度学习系列-词嵌入》，作者：Skytier。 1 特征表示在自然语言处理中，有一个很关键的概念是词嵌入，这是语言表示的一种方式，可以让算法自动的理解一些同类别的词，比如苹果、橘子，比如袜子、手套。 one-hot向量比如我们通常会说：“I want …

深度学习 2023年4月10日
000

合作推广

合作推广

返回顶部