caffe之(四)全连接层

2023年4月8日上午12:20 • Caffe

在caffe中，网络的结构由prototxt文件中给出，由一些列的Layer（层）组成，常用的层如：数据加载层、卷积操作层、pooling层、非线性变换层、内积运算层、归一化层、损失计算层等；本篇主要介绍全连接层

该层是对元素进行wise to wise的运算

1. 全连接层总述

下面首先给出全连接层的结构设置的一个小例子（定义在.prototxt文件中）

layer {
  name: "fc6"
  type: "InnerProduct"
  bottom: "pool5"
  top: "fc6"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  inner_product_param {
    num_output: 4096
    weight_filler {
      type: "gaussian"
      std: 0.005
    }
    bias_filler {
      type: "constant"
      value: 0.1
    }
  }
}

2. 全连接层相关参数

接下来，分别对全连接层的相关参数进行说明

（根据全连接层层的定义，它的学习参数应该为权值和bias，其他的相关参数都为hyper-paramers，在定义模型时是要给出的）

注：全链接层其实也是一种卷积层，只不过卷积核大小与输入图像大小一致

lr_mult：学习率系数

放置在param{}中

该系数用来控制学习率，在进行训练过程中，该层参数以该系数乘solver.prototxt配置文件中的base_lr的值为学习率

即学习率=lr_mult*base_lr

如果该层在结构配置文件中有两个lr_mult，则第一个表示权值学习率系数，第二个表示偏执项的学习率系数（一般情况下，偏执项的学习率系数是权值学习率系数的两倍）

inner_product_param：内积层的其他参数

放置在inner_product_param{}中

该部分对内积层的其他参数进行设置，有些参数为必须设置，有些参数为可选（因为可以直接使用默认值）

必须设置的参数

num_output：filter个数

其他可选的设置参数

weight_filter：权值初始化方法，使用方法如下
weight_filter{
}
bias_filter：偏执项初始化方法
bias_filter{
type:"xavier" //这里的xavier是一冲初始化算法，也可以是“gaussian”；默认值为“constant”，即全部为0
}
bias_term：是否使用偏执项，默认值为Ture

 参考：caffe tutorial

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：caffe之(四)全连接层 - Python技术站

Caffe 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

caffe之(五)loss层

上一篇 2023年4月8日

【caffe】train_lenet.sh在windows下的解决方案

下一篇 2023年4月8日

Caffe

【神经网络与深度学习】Win10+VS2015 caffe环境搭建（极其详细）

caffe是好用，可是配置其环境实在是太痛苦了，依赖的库很多不说，在VS上编译还各种报错，你能想象那种被一百多个红色提示所笼罩的恐惧。且网上很多教程是VS2013环境下编译的，问人很多也说让我把15卸载了装13，我的答案是：偏不记下这个艰难的过程，万一还要再来一次呢…… Attention：本文使用的caffe windows环境配置为： VS2015…

2023年4月8日
000
Jetson nano 安装 TensorFlow

高级程序工程师 2 人赞同了该文章安装依赖软件包 sudo apt-get install python3-pip 执行一下命令，修改文件中内容，如果不修改，后面依赖包无法安装 python3 -m pip install –upgrade pip sudo vim /usr/bin/pip3 源文件 from pip import main if _…

tensorflow 2023年4月6日
000
Caffe

CAFFE学习笔记（五）用caffe跑自己的jpg数据

1 收集自己的数据 1-1 我的训练集与测试集的来源：表情包由于网上一幅一幅图片下载非常麻烦，所以我干脆下载了两个eif表情包。同一个表情包里的图像都有很强的相似性，因此可以当成一类图像来使用。下载个eif解压包可以把eif文件解压成gif和jpg格式的文件，然后删除gif文件，只留下jpg格式的文件，这些图就是我的训练集与测试集了。 1-2 使用rena…

2023年4月6日
000
神经网络学习笔记-04-循环神经网络算法解释

神经网络学习笔记-04-循环神经网络算法解释本文是根据WildML的Recurrent Neural Networks Tutorial写的学习笔记。门控循环单元 – GRUs (Gated Recurrent Units) 先看看计算公式： \[x_e = Ex_t \\ z = \sigma(U^zx_e + W^zs_{t-1} + b^z) \\…

循环神经网络 2023年4月5日
000
常见的目标检测中的背景建模方法

Author: JW. ZHOU 2014/6/13 　　最近一直在做前景检测方面的研究，刚开始主要是做一些工程性的应用，为了解决工程方面的问题，下了不少功夫，也看了不少最近国内外的文章。一直想做个总结，拖着拖着，终究却写成这篇极不成功的总结。背景建模或前景检测的算法主要有： 1. Single Gaussian (单高斯模型) Real-time tra…

目标检测 2023年4月7日
000
tensorflow 基础学习九：mnist卷积神经网络

mnist_inference.py： # -*- coding:utf-8 -*- import tensorflow as tf # 配置神经网络参数 INPUT_NODE=784 OUTPUT_NODE=10 IMAGE_SIZE=28 NUM_CHANNELS=1 NUM_LABELS=10 # 第一层卷积层的尺寸和深度 CONV1_DEEP=32 …

卷积神经网络 2023年4月5日
000
tensorflow

tensorflow module data读取数据方式

以前的读取数据的方法实在是太复杂了，要建立各种队列，所以想换成这个更为简便的方式参照以上教程，同时结合自己的实际例子，学习如何简单高效读取数据（tensorflow api 1.4） Module: tf.data 1 @@Dataset 2 @@Iterator 3 @@TFRecordDataset 4 @@FixedLengthRecordData…

2023年4月6日
000
卷积神经网络

基于tensorflow的CNN卷积神经网络对Fasion-MNIST数据集的分类器(1)

写一个基于tensorflow的cnn，分类fasion-MNIST数据集这个就是fasion-mnist数据集这张图片是CNN的一般结构先上代码，在分析: import tensorflow as tf import pandas as pd import numpy as np config = tf.ConfigProto() confi…

2023年4月8日
000

合作推广

合作推广

返回顶部