深度学习相关问题的记录：验证集loss上升，准确率却上升

2023年4月13日下午10:58 • 深度学习

yizhihongxing

验证集loss上升，准确率却上升

验证集loss上升，acc也上升这种现象很常见，原因是过拟合或者训练验证数据分布不一致导致，即在训练后期，预测的结果趋向于极端，使少数预测错的样本主导了loss，但同时少数样本不影响整体的验证acc情况。ICML2020发表了一篇文章：《kid丶：【论文】一行代码发一篇ICML？。

validation loss 和 accuracy 不匹配的问题（尤其是cross entropy）已经有些工作专门去研究，代表作

这个情况在实际项目中其实挺常见的，说白了loss也好, accuracy也好，都是很片面且脆弱的评估指标。与模型结构与数据分布都有很大关系。具体如何选择模型应该与应用场景强相关。

在我把所有分类信息打印出来之后发现是模型过于极端导致的，即模型会出现在正确分类上给出0.00..x的概率值，导致loss异常的高，超过20，因此极大的提高了平均loss，导致出现了loss升高，acc也升高的奇怪现象。

loss和准确率本身就不是完全正比的关系，loss只是方便优化的一种近似。假设题主代码写对的情况下，一种可能的原因是，那些大量正确分类的easy samples的损失之和，大于少数错误分类的样本，因此优化loss反而会降低准确率，或者反过来，loss上升准确率也上升。

说了多少次了，不要看loss，loss波动很正常，loss设的不够好导致部分上升占主导，掩盖了另一部分的下降也很正常。

看acc，看参数统计量，这才是有效的。

REF

链接：https://www.zhihu.com/question/318399418/answer/1420848079
https://www.zhihu.com/question/291369144

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习相关问题的记录：验证集loss上升，准确率却上升 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

ReLeQ：一种自动强化学习的神经网络深度量化方法

上一篇 2023年4月13日

C++深度解析教程学习笔记（6）对象的构造和销毁

下一篇 2023年4月13日

深度学习accuracy

accuracy=(1+3)/(1+2+3+4)，即在所有样本（例子）中做出正确预测的的比例，或者说正确预测的样本数占总预测样本数的比值。 precision=(1)/(1+2)，指的是正确预测的正样本数占所有预测为正样本的数量的比值，也就是说所有预测为正样本的样本中有多少是真正的正样本。从这我们可以看出，accuracy考虑全部样本，而precisio…

深度学习 2023年4月13日
000
大数据学习[16]–使用scroll实现Elasticsearch数据遍历和深度分页[转]

题目：使用scroll实现Elasticsearch数据遍历和深度分页作者：星爷出处： http://lxWei.github.io/posts/%E4%BD%BF%E7%94%A8scroll%E5%AE%9E%E7%8E%B0Elasticsearch%E6%95%B0%E6%8D%AE%E9%81%8D%E5%8E%86%E5%92%8C%E6%B…

深度学习 2023年4月13日
000
【神经网络与深度学习】【计算机视觉】YOLO2

转自：https://zhuanlan.zhihu.com/p/25167153?refer=xiaoleimlnote 本文是对 YOLO9000: Better, Faster, Stronger （项目主页）的翻译。加了个人理解和配图。内容参考了 YOLOv2 论文笔记 – Jesse_Mx 。水平有限，错误之处欢迎指正。 1. 概述 YOLO2主要…

深度学习 2023年4月12日
000
《TensorFlow实战Google深度学习框架》笔记——TensorFlow环境搭建

一、TensorFlow的主要依赖包 1.Protocol Buffer Protocol Buffer负责将结构化的数据序列化，并从序列化之后的数据流中还原出原来的结构化数据。TensorFlow中的数据基本都是通过Protocol Buffer来组织的。结构化数据： name: 张三 id: 12345 email: zhangsan@abc.com …

深度学习 2023年4月12日
000
深度学习文献代码阅读-超分辨(ESRGAN)

ESRGAN是在SRGAN基础上进行增强的网络, 在2018年的比赛中获得了冠军 Introduction 介绍了基于PSNR指标获得的超分辨图像其结果会较为平滑，且与人们的主观有较大的差别作者针对SRGAN提出了…

深度学习 2023年4月13日
000
深度学习之加载VGG19模型分类识别

主要参考博客： https://blog.csdn.net/u011046017/article/details/80672597#%E8%AE%AD%E7%BB%83%E4%BB%A3%E7%A0%81http://www.cs.toronto.edu/~frossard/post/vgg16/ 1、物体分类 imagenet_classes.py cla…

深度学习 2023年4月11日
000
Deep-learning augmented RNA-seq analysis of transcript splicing | 用深度学习预测可变剪切

可变剪切的预测已经很流行了，目前主要有两个流派：用DNA序列以及variant来预测可变剪切；GeneSplicer、MaxEntScan、dbscSNV、S-CAP、MMSplice、clinVar、spliceAI 用RNA来预测可变剪切；MISO、rMATS、DARTS 前言废话科研圈的热点扎堆现象是永远存在的，且一波接一波，大部分不屑于追热点且不…

深度学习 2023年4月12日
000
深度学习

5 TensorFlow实战Google深度学习框架一书中的错误两处（交叉熵定义有误）

第一处：书中62页定义的交叉熵函数定义有误，虽然这个所谓交叉熵的数值能够减少，但是是不能提升预测性能的，因为定义就错了。我已经将预测过程可视化，直接将交叉熵改为我的，或者用原书的，就可以看到预测结果的变化。第二处： 150页，lenet第三层卷积层的连接数目是（10*10*16*（5*5*6+1））=241600.因为本层输入矩阵的深度是6，输出矩阵的…

2023年4月10日
000

合作推广

合作推广

返回顶部