训练较深的卷积神经网络时遇到的问题

2023年4月5日下午10:02 • 卷积神经网络

最近训练一个12层的cnn网络

参考了vgg和googlenets的思想，自己做了些微调

在有噪声的手写体识别上达到了98.59%的准确率

在训练时，前1000次，loss和acc就好像没有收敛一样

因为，神经网络太深，参数太多

我们要用更多时间去使网络提取到对应的参数

所以，一次训练到3k次以上之后再看效果

在训练的后期

train_acc = 0.997

varify_acc = 0.975的时候

我以为验证集准确率不会要有多大提升了

但是，再又训练了2k次之后

准确率提升了1%

超参数的选择：

前期训练是keep_prob=0.9, L2参数为0.01

为的是能让网络尽快收敛

后期的keep_prob 和L2参数自己根据网络过拟合情况自己调整

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：训练较深的卷积神经网络时遇到的问题 - Python技术站

人工智能卷积神经网络

0 0 打赏

微信扫一扫

支付宝扫一扫

【笔记】卷积

上一篇 2023年4月5日下午10:02

人脸识别性别的卷积神经网络

下一篇 2023年4月5日下午10:03

tensorflow

在Linux服务器非root权限下搭建TensorFlow框架(Anaconda)

今天终于动手折腾实验室的服务器啦！由于权限原因，只能在自己的路径下安装TensorFlow。 1. 下载安装Anaconda 官网下载地址：https://www.anaconda.com/download/#linux 下载对应版本，上传到服务器，执行： bash Anaconda3-2018.12-Linux-x86_64.sh 名称改成自己的相应版本。…

2023年4月8日
000
GAN生成对抗网络

对抗神经机器翻译：GAN＋NMT 模型，中国研究者显著提升机翻质量

今天介绍的是中山大学、中国科技大学、微软亚洲研究院与广东省信息安全技术重点实验室合作完成的一项研究。第一作者 Lijun Wu 来自中山大学数据与计算机科学学院，二作 Yingce Xia 是中国科技大学，Li Zhao、Fei Tian、Tao Qin 都属于微软亚洲研究院，Jianhuang Lai、Tie-Yan Liu 则是广东省信息安全技术重点实…

2023年4月6日
000
目标检测

目标检测Anchor-free分支：基于关键点的目标检测

https://blog.csdn.net/qiu931110/article/details/89430747 目标检测领域最近有个较新的方向：基于关键点进行目标物体检测。该策略的代表算法为：CornerNet和CenterNet。由于本人工作特性，对网络的实时性要求比较高，因此多用YoLov3及其变体。而就在今天下午得知，基于CornerNet改进的Co…

2023年4月8日
000
【机器学习PAI实战】—— 玩转人工智能之你最喜欢哪个男生？

摘要：分类问题是生活中最常遇到的问题之一。普通人在做出选择之前，可能会犹豫不决，但对机器而言，则是唯一必选的问题。我们可以通过算法生成模型去帮助我们快速的做出选择，而且保证误差最小。充足的样本，合适的算法可以透过表象的类别，进而挖掘其内在的联系、区别，找出最佳的的属性来区分每个样本的类别。模型训练与在线预测服务、推荐算法四部曲、机器学习PAI实战、更多精…

机器学习 2023年4月15日
000
caffe: fuck compile error again : error: a value of type “const float *” cannot be used to initialize an entity of type “float *”

wangxiao@wangxiao-GTX980:~/Downloads/caffe-master$ make -j8find: `wangxiao/bvlc_alexnet/spl’: No such file or directoryfind: `caffemodel’: No such file or directoryfind: `wangxiao/…

Caffe 2023年4月8日
000
Caffe

Caffe源代码中Solver文件分析

Caffe源代码(caffe version commit: 09868ac , date: 2015.08.15)中有一些重要的头文件，这里介绍下include/caffe/solver.hpp文件的内容： 1. include文件： <caffe/solver.hpp>：此文件的介绍能够參考： http://blog.csdn.ne…

2023年4月6日
000
Keras

keras BatchNormalization 之坑

任务简述：最近做一个图像分类的任务，一开始拿vgg跑一个baseline，输出看起来很正常：随后，我尝试其他的一些经典的模型架构，比如resnet50, xception，但训练输出显示明显异常： val_loss 一直乱蹦，val_acc基本不发生变化。检查了输入数据没发现问题，因此怀疑是网络构造有问题，对比了vgg同xception，…

2023年4月8日
000
目标检测

目标检测之Faster R-CNN通俗详解

算法简介我们都知道，Fast R-CNN虽然提高了目标检测算法质的飞跃，但是在Fast R-CNN中仍然存在很大的瓶颈，那就是候选框选取特别耗时的问题，而Faster R-CNN恰恰就是在这一问题上的解决方案。关于Faster R-CNN，是rgb在2015年提出，他将proposal的提取、特征提取、boundingbox回归和分类都放到一个网络中，提高了…

2023年4月8日
000

合作推广

返回顶部

训练较深的卷积神经网络时遇到的问题

相关文章