caffe中train过程的train数据集、val数据集、test时候的test数据集区别

2023年4月5日下午9:57 • Caffe

val是validation的简称。
training dataset 和 validation dataset都是在训练的时候起作用。
而因为validation的数据集和training没有交集，所以这部分数据对最终训练出的模型没有贡献。
validation的主要作用是来验证是否过拟合、以及用来调节训练参数等。

比如你训练0-10000次迭代过程中，train和validation的loss都是不断降低，
但是从10000-20000过程中train loss不断降低， validation的loss不降反升。
那么就证明继续训练下去，模型只是对training dataset这部分拟合的特别好，但是泛化能力很差。
所以与其选取20000次的结果，不如选择10000次的结果。
这个过程的名字叫做 Early Stop， validation数据在此过程中必不可少。

如果你去跑caffe自带的训练demo，你会用到train_val.prototxt，这里面的val其实就是validation。
而网络输入的TEST层，其实就是validation，而不是test。你可以通过观察validation的loss和train的loss定下你需要的模型。

但是为什么现在很多人都不用validation了呢？
我的理解是现在模型中防止过拟合的机制已经比较完善了，Dropout\BN等做的很好了。
而且很多时候大家都用原来的模型进行fine tune，也比从头开始更难过拟合。
所以大家一般都定一个训练迭代次数，直接取最后的模型来测试。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：caffe中train过程的train数据集、val数据集、test时候的test数据集区别 - Python技术站

Caffe 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

深度学习caffe测试代码c++

上一篇 2023年4月5日

make pycaffe时候报错：Makefile:501: recipe for target ‘python/caffe/_caffe.so’ failed

下一篇 2023年4月5日

Tensorflow InternalError: Blas SGEMM launch failed

关闭其他的进程(比如IPython,jupyter notebook等)参考链接:https://stackoverflow.com/questions/37337728/tensorflow-internalerror-blas-sgemm-launch-failed

tensorflow 2023年4月7日
000
张量（Tensor）、标量（scalar）、向量（vector）、矩阵（matrix）

张量（Tensor）：Tensor = multi-dimensional array of numbers 张量是一个多维数组，它是标量，向量，矩阵的高维扩展，是一个数据容器，张量是矩阵向任意维度的推广注意，张量的维度（dimension）通常叫作轴（axis）, 张量轴的个数也叫作阶（rank）］标量（scalar）：只有一个数字的张量叫标量（也叫…

人工智能概论 2023年5月11日
000
机器学习（五）：混合高斯聚类（求聚类标签）+PCA降维（3维降2维）习题

使用混合高斯模型 GMM，计算如下数据点的聚类过程：\(Data = np.array([1,2,6,7])\) 均值初值为:\(\mu_1, \mu_2 = 1, 5\) 权重初值为:\(w_1, w_2 = 0.5, 0.5\) 方差:\(std_1, std_2 = 1, 1\)\(K = 2\) 10 次迭代后数据的聚类标签是多少？采用python…

机器学习 2023年4月10日
000
Caffe

（原）torch和caffe中的BatchNorm层

转载请注明出处： http://www.cnblogs.com/darkknightzh/p/6015990.html BatchNorm具体网上搜索。 caffe中batchNorm层是通过BatchNorm+Scale实现的，但是默认没有bias。torch中的BatchNorm层使用函数SpatialBatchNormalization实现，该函数中有…

2023年4月8日
000
目标检测

深度学习笔记之使用Faster-Rcnn进行目标检测（实践篇）

　　我使用的代码是Python版本的Faster Rcnn，官方也有Matlab版本的,链接如下: py-faster-rcnn(python) faster-rcnn(matlab) 环境配置　　按照官方的README进行配置就好,不过在这之前大家还是看下硬件要求吧 For training smaller networks (Z…

2023年4月6日
000
目标检测

大盘点！CVPR 2020目标检测论文精选

本文为学习笔记参与：王博kings，Sophia 最近结束的CVPR 2020在推动物体检测方面做出了巨大贡献。在本文中，我们将介绍一些特别令人印象深刻的论文。 1、A Hierarchical Graph Network for 3D Object Detection on Point Clouds（用于点云3D目标检测的分层图网络） HGNet包含三个…

2023年4月8日
000
Keras

吴裕雄–天生自然神经网络与深度学习实战Python+Keras+TensorFlow：使用神经网络预测房价中位数

import pandas as pd data_path = ‘/Users/chenyi/Documents/housing.csv’ housing = pd.read_csv(data_path) housing.info() housing.head() housing.describe() housing.hist(bins=50, figsiz…

2023年4月8日
000
卷积公式相关证明

对给定函数f(t),g(t)拉普拉斯变换得将上面二式相乘，并建立下面的等式这意味着两个函数分别进行拉普拉斯变换的结果相乘等于某个未知函数h(t)进行一次拉普拉斯变换的结果，现在问题变成了求解h(t)，过程如下：上面推理过程，主要考虑到定积分可以看作是数列求和的极限，比如两个数列相乘可以进行如下转化：

卷积神经网络 2023年4月7日
000

合作推广

合作推广

返回顶部