怎样提高深度学习的效果？

2023年4月11日上午3:19 • 深度学习

怎么让深度学习模型获得更好的效果？这个是一直有人问我的问题，或者可以这么问？

我怎么提高正确率？或者为什么我的深度神经网络效果这么差？我经常这样回复“”我给不出确切的答案，但是我能给你一些建议“”

下面我将列一些我认为会对提升学习效果有效的一些建议。我将这些想法mark到下面，这些想法不仅仅对深度学习有用，而且对机器学习同样有效。

提升学习算法性能的四个建议

1 通过数据

2 通过算法

3 通过微调算法

4 采用集成ensembles方式，

一通过数据：

1）获取更多的数据

2）发明更多的数据

3）重新调整你的数据

4）变换你的数据

5）特征选择

获取更多的数据

模型的质量取决于你训练数据的质量。你需要最好的数据去解决你的问题，同时你也需要最多的数据。

深度学习和其他非线性技术的机器学习技术在数据越多时，效果越好。深度学习尤其是这样。

怎样提高深度学习的效果？

在图中可以看出，当数据量超过一定阶段，普通的机器学习算法到了精度极限了，但是深度学习不是。

发明更多的数据

深度学习算法在数据量大时效果会更好，但是当我们没办法获得大量的数据，我们可以发明更多的数据

一、如果你的数据是数字向量，依据已有的向量进行随机修改

二、如果你的数据是图片，依据已有的图像进行随机修改例如尺度缩放、旋转、平移

上述方法被称为数据增广

在caffe中的数据层，如下图所示，中间那个镜像和crop_size就对应图像的两种操作，是数据数据增广的方式

怎样提高深度学习的效果？

相关链接：

重新调整你的数据

这是一个速赢的策略，这个策略在神经网络中是这样：

将数据调整到激活函数的边界范围内，如果是sigmoid激活函数，将数据调整到0-1之间，如果是tanh激活函数，将数据调整到-1,1之间。这个策略适用于输入数据X和输出数据Y，例如在神经网络输出层采用sigmoid激活函数进行二值预测，就可以归一化输出y到二值数据（0或者1)。如果是采用的softmax方式，即最终输出的结果代表的是该输出的概率，你同样也可以对中间层进行归一化。

三种归一化的方式：一、归一化到（0,1）；二、归一化到（-1,1）；三、数据标准化，即平均值为0，方差为1

在caffe中，对数据进行读取时，一般需要去均值操作，也就是计算数据的平均值，可以采用tools工具中的compute_image_mean.cpp,实际上这个操作就对应这个策略！

变换你的数据

除了上面的一些变换方法，还可以尝试下面的做法：

将数据可视化进行观察，对每一列数据（单个特征数据）进行观察：

1 每一列的数据是否看着像偏态高斯，可以通过Box-Cox变换调整偏态

2 每一列的数据是否看着像指数分布，可以尝试log变换

3 每一列的数据是否像被击倒或者切掉，可以尝试平方或者平方根

4 一些特征是不是可以进行离散化或者二值化，用来突出某些特征

基于你的直觉，可以尝试下面的做法：

数据是不是可以通过投影的方式类似PCA进行预处理？

能否把多个属性聚集成一个？

通过设置bool标志挖掘数据中潜在的信息

多抽查几种不同的变化数据的方式

相关链接：

特征选择

分为：

过滤方式：过滤特征选择方法运用统计方法将一个分值分配给每个特征.这些特征按照分数排序,然后决定是被保留还是从数据集中删除.这个方法通常是单变量且独立的考虑每个特征,或者考虑其依赖变量.一些过滤方法包括Chi squared test(方卡检验),information gain(信息增益)和correlation coefficient scores(相关系数得分).

包装方式：包装方法考虑一族特征作为搜索问题,不同的组合被准备,检验并和其他组合比较. 我们使用一个预测模型评估特征的组合,然后根据模型精度给每个特征组合一个分数.

这个搜索过程可能有条不紊的例如best-fist搜索算法, 它可能随机例如random hill-climbing 算法.或者它可能是启发式的例如前向和后向传递增添和删除特征的.一个例子就是递归特征消除算法.

嵌入方式：嵌入式算法在模型创建的时候,学习哪些特征对于模型精度的贡献最大.最典型的嵌入式特征选择方法是正则化方法.正则化方法也被称为引入附加约束到预测算法(例如回归算法)的优化,它偏向于较低复杂度的模型.正则规划算法的例子是Lasso,Elastic Net和Ridge Regression.

二通过算法：

How To Improve Deep Learning Performance

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：怎样提高深度学习的效果？ - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

实战深度学习OpenCV(三)：视频实时canny边缘检测

上一篇 2023年4月11日

深度学习概述

下一篇 2023年4月11日

关于入门深度学习mnist数据集前向计算的记录

import osimport lr as lrimport tensorflow as tffrom pyspark.sql.functions import stddevfrom tensorflow.keras import datasetsos.environ[‘TF_CPP_MIN_LOG_LEVEL’]=’2′ #只打印error的信息(x,y)…

深度学习 2023年4月10日
000
强化学习 —— reinforce算法中更新一次策略网络时episodes个数的设置对算法性能的影响 —— reinforce算法中迭代训练一次神经网络时batch_size大小的不同设置对算法性能的影响深度学习中使用TensorFlow或Pytorch框架时到底是应该使用CPU还是GPU来进行运算？？？

本文相关的博客：（预先知识）强化学习中经典算法 —— reinforce算法 —— （进一步理解，理论推导出的计算模型和实际应用中的计算模型的区别）本文代码地址： https://gitee.com/devilmaycry812839668/cart-pole_-policy-network_-reinforce ==========…

深度学习 2023年4月13日
000
深度学习LiDAR定位：L3-Net

深度学习LiDAR定位：L3-Net 摘要本文提出L3-Net——一种新颖的基于学习的LiDAR定位系统，可实现厘米级的定位，与现有最高水平的传统定位算法相媲美。与传统定位算法不同，本文创新地实现了使用各种深度神经网络结构来建立基于学习的定位算法。首先，L3-Net会学习专门针对不同现实驾驶场景中的匹配而优化的局部描述，在解决方案空间中建立的成本量上的3D…

深度学习 2023年4月13日
000
《Redis深度历险：核心原理和应用实践》学习笔记一

1.redis五种数据结构 1.1 String字符串类型，对应java字符串类型用户信息序列化后，可以用string类型存入redis中批量读写string类型，见效网络消耗数字类型的string类型，可以自增自减操作，有一个大小限制。 1.2 list类型，对应java的LinkedList，链表结构。增删O(1)，查询O(n)异步队列，一边线程塞入…

深度学习 2023年4月10日
000
吴恩达《深度学习》第四门课（4）特殊应用：人脸识别和神经风格迁移

4.1什么是人脸识别（1）人脸验证（face verification）:1对1，输入一个照片或者名字或者ID，然后判断这个人是否是本人。（2）人脸识别（face recognition）:1对多，判断这个人是否是系统中的某一个人。 4.2One-shot学习（1）比如一个公司的员工，一般每个人只给一张工作照（如4个人），这时网络输出五个单元，分别代表…

深度学习 2023年4月11日
000
[信息抽取]基于ERNIE3.0的多对多信息抽取算法：属性关系抽取

本项目讲解了基于ERNIE信息抽取技术，对属性和关系的抽取涉及多对多抽取，主要是使用可ERNIEKIT组件，整体效果非常不错，当然追求小样本学习的可以参考之前UIE项目或者去官网看看paddlenlp最新的更新，对训练和部署进行了提速。 [信息抽取]基于ERNIE3.0的多对多信息抽取算法：属性关系抽取实体关系，实体属性抽取是信息抽取的关键任务；实体关系抽…

深度学习 2023年4月9日
000
深度学习

Deep Learning 13_深度学习UFLDL教程：Independent Component Analysis_Exercise（斯坦福大学深度学习教程）

前言理论知识：UFLDL教程、Deep learning：三十九(ICA模型练习) 实验环境：win7， matlab2015b，16G内存，2T机械硬盘难点：本实验难点在于运行时间比较长，跑一次都快一天了，并且我还要验证各种代价函数的对错，所以跑了很多次。实验内容：Exercise:Independent Component Analysis。从数据…

2023年4月9日
000
深度学习入门-环境搭建

————————————————————————————————————— 环境搭建 http://www.tuicool.com/articles/eiM3Er3 由于我们的源码是PYTHON，所以要安装pyt…

深度学习 2023年4月10日
000

合作推广

合作推广

返回顶部