深度学习系列专题之优化方法（1）

2023年4月11日上午4:22 • 深度学习

深度学习中定义的损失函数基本上都是极度非凸的函数，仅使用梯度下降法（SGD）很容易陷入局部最优解，本系列打算讲解以下方法：

1、SGD (On the importance of initialization and momentum in deep learning)

2、momentum

3、Nesterov accelerated gradient

4、Adagrad (Adaptive Subgradient Methods for online learning and stochastic optimization)

5、RMSprop (Genderating Sequences with recurrent neural networks)

6、Rprop (resilient backpropagation algorithm)

7、Adadelta (Adadelta: an adaptive learning rate method)

8、Adam (A method for stochastic optimization)

9、AMSGrad (On the convergence of Adam and Beyond)

10、AdaBound (Adaptive gradient methods with dynamic bound of learning rate)

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习系列专题之优化方法（1） - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

【深度学习】：梯度下降，随机梯度下降（SGD），和mini-batch梯度下降

上一篇 2023年4月11日

深度学习之group convolution,计算量及参数量

下一篇 2023年4月11日

深度学习面试题24：在每个深度上分别卷积(depthwise卷积)

　　举例　　单个张量与多个卷积核在深度上分别卷积　　参考资料举例如下张量x和卷积核K进行depthwise_conv2d卷积结果为： depthwise_conv2d和conv2d的不同之处在于conv2d在每一深度上卷积，然后求和，depthwise_conv2d没有求和这一步，对应代码为： import tensorflow as tf…

深度学习 2023年4月12日
000
《动手学深度学习》task05课后习题

Task05：卷积神经网络基础；leNet；卷积神经网络进阶学习笔记见：https://www.cnblogs.com/guohaoblog/p/12325038.html 卷积神经网络基础 1、假如你用全连接层处理一张256×256的彩色（RGB）图像，输出包含1000个神经元，在使用偏置的情况下，参数数量是： A、65536001 B、655370…

深度学习 2023年4月13日
000
转载：Ubuntu16.04 使用深度学习和OpenCV实现物体检测

[PyImageSearch] Ubuntu16.04 使用深度学习和OpenCV实现物体检测　　上一篇博文中讲到如何用OpenCV实现物体分类，但是接下来这篇博文将会告诉你图片中物体的位置具体在哪里。　　我们将会知道如何使用OpenCV‘s的dnn模块去加载一个预训练的物体检测网络，它能使得我们将输入图像通过网络并且获得每个物体在图像中的输出位置。　…

深度学习 2023年4月13日
000
PGL图学习之基于GNN模型新冠疫苗任务[系列九]

本项目讲了论文节点分类任务和新冠疫苗任务，并在论文节点分类任务中对代码进行详细讲解。PGL八九系列的项目耦合性比较大，也花了挺久时间研究希望对大家有帮助。 PGL图学习之基于GNN模型新冠疫苗任务[系列九] 项目链接：https://aistudio.baidu.com/aistudio/projectdetail/5123296?contributionT…

深度学习 2023年4月13日
000
《神经网络和深度学习》系列文章二：感知机

出处： Michael Nielsen的《Neural Network and Deep Leraning》，点击末尾“阅读原文”即可查看英文原文。本节译者：哈工大SCIR硕士生徐梓翔 (https://github.com/endyul) 声明：我们将在每周一，周四，周日定期连载该书的中文翻译，如需转载请联系wechat_editors@ir.hit.…

深度学习 2023年4月12日
000
深度学习实践-物体检测-faster-RCNN(原理和部分代码说明) 1.tf.image.resize_and_crop(根据比例取出特征层，进行维度变化) 2.tf.slice(数据切片) 3.x.argsort()(对数据进行排列,返回索引值) 4.np.empty(生成空矩阵) 5.np.meshgrid(生成二维数据) 6.np.where(符合条件的索引) 7.tf.gather取值

1. tf.image.resize_and_crop(net, bbox, 256, [14, 14], name) # 根据bbox的y1,x1,y2,x2获得net中的位置，将其转换为14*14，因此为[14, 14, 512], 256表示转换的个数，最后的维度为[256, 14, 14, 512] 参数说明：net表示输入的卷积层，bbox表示y…

深度学习 2023年4月13日
000
深度学习-CNN+RNN笔记

以下叙述只是简单的叙述，CNN+RNN(LSTM,GRU)的应用相关文章还很多，而且研究的方向不仅仅是下文提到的1. CNN 特征提取，用于RNN语句生成图片标注。2. RNN特征提取用于CNN内容分类视频分类。3. CNN特征提取用于对话问答图片问答。还有很多领域，比如根据面目表情判断情感，用于遥感地图的标注，用于生物医学的图像解析，用于安全领域的防火实时…

深度学习 2023年4月13日
000
《神经网络和深度学习》系列文章十六：反向传播算法代码

出处： Michael Nielsen的《Neural Network and Deep Learning》，点击末尾“阅读原文”即可查看英文原文。本节译者：哈工大SCIR硕士生李盛秋声明：如需转载请联系wechat_editors@ir.hit.edu.cn，未经授权不得转载。使用神经网络识别手写数字反向传播算法是如何工作的热身：一个基于矩阵的…

深度学习 2023年4月12日
000

合作推广

返回顶部

深度学习系列专题之优化方法（1）

相关文章