caffe 中的的参数

2023年4月8日上午8:37 • Caffe

yizhihongxing

base_lr：初始学习率

momentum：上一次梯度权重

weight_decay：正则项系数

以上三个参数是SGD的核心，关于base_lr和momentum见：http://caffe.berkeleyvision.org/tutorial/solver.html

关于weight_decay: http://stats.stackexchange.com/questions/29130/difference-between-neural-net-weight-decay-and-learning-rate

lr_policy：（gamma、power、step）学习率更新规则，见caffe代码

// Return the current learning rate. The currently implemented learning rate
// policies are as follows:
//    - fixed: always return base_lr.
//    - step: return base_lr * gamma ^ (floor(iter / step))
//    - exp: return base_lr * gamma ^ iter
//    - inv: return base_lr * (1 + gamma * iter) ^ (- power)
//    - multistep: similar to step but it allows non uniform steps defined by
//      stepvalue
//    - poly: the effective learning rate follows a polynomial decay, to be
//      zero by the max_iter. return base_lr (1 - iter/max_iter) ^ (power)
//    - sigmoid: the effective learning rate follows a sigmod decay
//      return base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))
//

lr_mult：每一层都有两个lr_mult参数代表本层的学习率，第一个是base_lr*lr_mult代表本层样本，第二个是bias 的学习率

xavier：初始化参数，trick，见Understanding the difficulty of training deep feedforward neural networks

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：caffe 中的的参数 - Python技术站

Caffe 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

上一篇 2023年4月8日

[caffe] 安装及使用注意

下一篇 2023年4月8日

循环神经网络

循环神经网络(一)-RNN入门

首先学习RNN需要一定的基础，即熟悉普通的前馈神经网络，特别是BP神经网络，最好能够手推。所谓前馈，并不是说信号不能反向传递，而是网络在拓扑结构上不存在回路和环路。而RNN最大的不同就是存在环路。为什么需要RNN 1. 特征之间序列性普通的神经网络的输入，具备样本独立同分布（iid），特征也是独立的，多数也是同分布的，特征之间谁先谁后无所谓， …

2023年4月5日
000
循环神经网络

RNN循环神经网络里的BPTT算法

这两天对RNN循环神经网络进行了学习，由一无所知到现在对什么是RNN以及它的前向传播和反向传播有了认识，尤其是BPTT算法的推导有些繁琐，但是推过一次后，对RNN反向传播求梯度的过程有了更清晰的认识。下面是朴素的RNN循环神经网络图。（图1）我在写博客前，自己先手写了一份推导过程。（图2）为何BPTT更难？因为多了状态之间的传递（即隐层单元之间的“交…

2023年4月6日
000
tensorflow 和cuda对应关系

Version Python version Compiler Build tools tensorflow-1.11.0 2.7, 3.3-3.6 GCC 4.8 Bazel 0.15.0 tensorflow-1.10.0 2.7, 3.3-3.6 GCC 4.8 Bazel 0.15.0 tensorflow-1.9.0 2.7, 3.3-3.6 GC…

tensorflow 2023年4月6日
000
卷积神经网络

卷积神经网络去雾去雨方法

卷积神经网络去雾去雨方法标题：A Convolutional Network for Joint Deraining and Dehazing from A Single Image for Autonomous Driving in Rain 作者：Hao Sun, Marcelo H. Ang Jr. and Daniela Rus 来源：IEEE/R…

2023年4月8日
000
Caffe

用vs2013（cpu-only）调试caffe的mnist

在调试Mnist例子之前，首先需要用vs2013编译好caffe。详情请参见：【caffe-Windows】caffe+VS2013+Windows无GPU快速配置教程按照上述教程编译好caffe后，开始编译并调试MNIST. 1. 下载好MINIST数据：http://pan.baidu.com/s/1o7YrhKe，下载完之后解压到examplesm…

2023年4月8日
000
概念（机器学习）：有监督、无监督、半监督学习

来源：机器学习算法盘点 – ranjiewen – 博客园 http://www.cnblogs.com/ranjiewen/p/6235388.html 机器学习的算法很多。很多算法是一类算法，而有些算法又是从其他算法中延伸出来的。这里从两个方面来给大家介绍，第一个方面是学习的方式，第二个方面是算法的类似性。学习方式　　根据数据类型的不同，对…

机器学习 2023年4月11日
000
卷积神经网络

一些卷积概念和图解

目录 RGB 3通道卷积 3D卷积空洞卷积推荐一个链接（用Excel实现多种维度的卷积）：https://medium.com/apache-mxnet/multi-channel-convolutions-explained-with-ms-excel-9bbf8eb77108 其中3维卷积是这样的：我以前的错误理解：如果输出通道只有1个，那么就只有…

2023年4月8日
000
卷积、卷积矩阵（Convolution matrix）与核（Kernel）

在图像处理领域，Kernel = convolution matrix = mask，它们一般都为一个较小的矩阵；用于：Sharpen，Blur， Edge enhance，Edge detect，Emboss（使凸出；在……上作浮雕图案；装饰） 1. 卷积操作与卷积矩阵的等价性（1）创建一维信号 N = 100; s = zeros(N, 1); k …

卷积神经网络 2023年4月8日
000

合作推广

合作推广

返回顶部