Caffe 全连接层

2023年4月8日下午2:08 • Caffe

深度学习笔记（6）全连接层的实现：全连接层的每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。由于其全相连的特性，一般全连接层的参数也是最多的。

全连接层的前向计算

下图中连线最密集的2个地方就是全连接层，这很明显的可以看出全连接层的参数的确很多。在前向计算过程，也就是一个线性的加权求和的过程，全连接层的每一个输出都可以看成前一层的每一个结点乘以一个权重系数W，最后加上一个偏置值b得到，即。如下图中第一个全连接层，输入有50*4*4个神经元结点，输出有500个结点，则一共需要50*4*4*500=400000个权值参数W和500个偏置参数b。

Caffe 全连接层

下面用一个简单的网络具体介绍一下推导过程

Caffe 全连接层

其中，x1、x2、x3为全连接层的输入，a1、a2、a3为输出，根据我前边在笔记1中的推导，有

Caffe 全连接层

可以写成如下矩阵形式：

Caffe 全连接层

全连接层的反向传播

以我们的第一个全连接层为例，该层有50*4*4=800个输入结点和500个输出结点。

Caffe 全连接层

由于需要对W和b进行更新，还要向前传递梯度，所以我们需要计算如下三个偏导数。

1、对上一层的输出（即当前层的输入）求导

若我们已知转递到该层的梯度，则我们可以通过链式法则求得loss对x的偏导数。
首先需要求得该层的输出ai对输入xj的偏导数 Caffe 全连接层

再通过链式法则求得loss对x的偏导数： Caffe 全连接层

上边求导的结果也印证了我前边那句话：在反向传播过程中，若第x层的a节点通过权值W对x+1层的b节点有贡献，则在反向传播过程中，梯度通过权值W从b节点传播回a节点。

若我们的一次训练16张图片，即batch_size=16，则我们可以把计算转化为如下矩阵形式。

Caffe 全连接层

2、对权重系数W求导

我们前向计算的公式如下图，

Caffe 全连接层

由图可知，所以： Caffe 全连接层。

当batch_size=16时，写成矩阵形式：

Caffe 全连接层

3、对偏置系数b求导

由上面前向推导公式可知 Caffe 全连接层，

即loss对偏置系数的偏导数等于对上一层输出的偏导数。

当batch_size=16时，将不同batch对应的相同b的偏导相加即可，写成矩阵形式即为乘以一个全1的矩阵：

Caffe 全连接层

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Caffe 全连接层 - Python技术站

Caffe 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

【caffe】推荐一个可以在线将caffe模型文件可视化的网站

上一篇 2023年4月8日下午2:07

Ubuntu16.04+anaconda2+caffe+ssd+opencv3.1.0在编译caffe过程中的问题及解决方法主要遇到三个问题，前两个是caffe在cmake过程中的问题，后一

下一篇 2023年4月8日下午2:09

（六） Keras 模型保存和RNN简单应用

视频学习来源 https://www.bilibili.com/video/av40787141?from=search&seid=17003307842787199553 笔记 RNN用于图像识别并不是很好模型保存（结构和参数） 1 需要安装h5py pip install h5py 2在代码最后一行 model.save(‘model.h5’)…

Keras 2023年4月8日
000
修复漏洞【检测到目标主机可能存在缓慢的HTTP拒绝服务攻击】

漏洞名称：　　检测到目标主机可能存在缓慢的HTTP拒绝服务攻击解决方法：　　修改apache的配置文件apache/conf/httpd.conf,在配置中添加以下配置　　　　LoadModule reqtimeout_module modules/mod_reqtimeout.so 　　　　<IfModule reqtimeout_modul…

目标检测 2023年4月6日
000
循环神经网络

吴恩达老师深度学习视频课笔记：循环神经网络

Why sequence models?：序列数据例子，如下图：(1).语音识别(speech recognition)：给定一个输入音频片段X，并要求输出片段对应的文字记录Y，这里输入和输出都是序列数据(sequence data)。因为X是按时序播放的音频片段，输出Y是一系列单词。(2). 音乐生成(music generation)：只有输出数据Y是序…

2023年4月8日
000
Caffe

寒武纪芯片——有自己的SDK，支持tf、caffe、MXNet

寒武纪芯片产品中心>智能处理器IP 智能处理器IP MLU智能芯片软件开发环境 Cambricon-1A 高性能硬件架构及软件支持兼容Caffe、Tensorflow、MXnet等主流AI开发平台，已多次成功流片国际上首个成功商用的深度学习处理器IP产品，可广泛应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。 Cambricon-1H…

2023年4月8日
000
Caffe

Caffe 源码阅读（二）卷积层

背景：项目中需要在 caffe 中增加 binary convolution layer，所以在单步调试了 minist 的训练，大致看了一下流程，就详细看 convolution layer 了。 1、数据结构　　caffe 的基本数据结构是 Blob，也就是数据流的基本结构。 2、网络结构　　Net 是 Layer 构造出来的，Layer 包括了…

2023年4月8日
000
TensorFlow入门：Graph

TensorFlow的计算都是基于图的。如果不特殊指定，会使用系统默认图。只要定义了操作，必然会有一个图（自定义的或启动默认的）。自定义图的方法： g=tf.Graph() 查看系统当前的图： tf.get_default_graph() 如果想讲自定义的图设置为默认图，可使用如下指令： g.as_default() 在某个图内定义变量及操作（’coll…

tensorflow 2023年4月7日
000
目标检测

计算机视觉中目标检测任务脉络梳理

前言：本文主要梳理了目标检测任务，包括目标检测简介、常用数据集、常用技巧，以及经典的两段式和一段式模型。目标检测（Object Detection）的目的是“识别目标并给出其在图中的确切位置”，其内容可解构为三部分：识别某个目标（Classification）；给出目标在图中的位置（Localization）；识别图中所有的目标及其位置（Detection…

2023年4月7日
000
GAN生成对抗网络

对抗神经机器翻译：GAN＋NMT 模型，中国研究者显著提升机翻质量

今天介绍的是中山大学、中国科技大学、微软亚洲研究院与广东省信息安全技术重点实验室合作完成的一项研究。第一作者 Lijun Wu 来自中山大学数据与计算机科学学院，二作 Yingce Xia 是中国科技大学，Li Zhao、Fei Tian、Tao Qin 都属于微软亚洲研究院，Jianhuang Lai、Tie-Yan Liu 则是广东省信息安全技术重点实…

2023年4月6日
000

合作推广

合作推广

返回顶部