卷积神经网络CNN公式推导走读

2023年4月7日下午10:27 • 卷积神经网络

0有全连接网络，为什么还需要CNN

图像处理领域的特殊性，

全连接网络缺点： CNN解决办法：

1参数太多 | 局部连接

2没有利用图像之间位置的信息 | 权值共享

3网络层数限制 | 下采样：pooling，只保留重要参数，提高鲁棒性

1激活函数

Relu：

图像：

sigmoid图像：

相比sigmoid优势：

1速度快，因为运算简单max ；

2 坚强梯度消失问题，梯度计算时每经过一层就累乘一个sigmoid的导数，图像可以看出最大是1/4，而relu导数是1，不会衰减；

3稀疏性：大脑5%的神经元是激活的，神经网络15%比较好，sigmoid有50%激活，relu小于0的都是不机会的，所以激活概率更低。

2网络架构： INPUT -> [[CONV]*N -> POOL?]*M -> [FC]*K

卷积层池化层全连接层

2.1卷积层（多维的，维度=卷积核的个数）

局部连接：只有上一层部分神经元相连；

权值共享：对所有像素的权值都是一样的，个数为filter的个数：3*3的filter有3*3个权值。

注：深度大于1的输入，filter是深度比较与输入深度一致

2.2池化层

主要作用是下采样去掉不重要的样本，进一步减少参数个数。除了取max 还有mean等方法

2.3全连接层（同bp网络）

3训练

bp原理一样（三步）：

不同：

局部连接和下采样影响第二步误差项计算;

权值共享影响第三步w的计算；

3.1卷积层训练

同bp借用netj，卷积conv（矩阵）：

由于权重共享，a1,2 需要累加a1,1 和a1,2的影响：

eg1.a1,1与netj1,1有关：

所以，

eg2.a1,2与netj1,1 和netj1,2有关：

所以，

总结，

可以写成：

3.2池化层训练

由于没有需要学习的参数，只是梯度传递（max或mean），所以不需要梯度计算。

eg max

梯度等于l-1层值最大的

eg.mean 梯度等于1/n^2

参考：网络博客

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：卷积神经网络CNN公式推导走读 - Python技术站

人工智能卷积神经网络

0 0 打赏

微信扫一扫

支付宝扫一扫

二维卷积运算工作原理剖析（转载）

上一篇 2023年4月7日

【RS】Automatic recommendation technology for learning resources with convolutional neural network – 基于卷积神经网络的学习资源自动推荐技术

下一篇 2023年4月7日

循环神经网络

5 什么是LSTM-RNN（长短期记忆循环神经网络）？

RNN循环神经网络是有其弊端的，例如有这样一段话我们需要处理：今天我要做西红柿鸡蛋，我需要先去市场买两个西红柿，再买两个鸡蛋，回家之后，切西红柿，点火，放锅…… 我们需要让计算机判断我们做了一道什么菜，使用RNN，误差在时间序列上不断的累加，可能忘记了最开始的“西红柿鸡蛋”这个事啦。再来看看 RNN是怎样学习的吧. 西红柿鸡蛋这个信息原的记忆要进过长途跋…

2023年4月8日
000
怎样在caffe中添加layer以及caffe中triplet loss layer的实现

关于triplet loss的原理。目标函数和梯度推导在上一篇博客中已经讲过了。详细见：triplet loss原理以及梯度推导。这篇博文主要是讲caffe下实现triplet loss。编程菜鸟。假设有写的不优化的地方，欢迎指出。新版的caffe中添加新的layer。变得轻松多了。概括说来。分四步： 1）在./src/caffe/proto/caffe.…

Caffe 2023年4月7日
000
循环神经网络

简述循环神经网络

RNN 可用于许多不同的地方。下面是 RNN 应用最多的领域。 1. 语言建模和文本生成给出一个词语序列，试着预测下一个词语的可能性。这在翻译任务中是很有用的，因为最有可能的句子将是可能性最高的单词组成的句子。 2. 机器翻译将文本内容从一种语言翻译成其他语言使用了一种或几种形式的 RNN。所有日常使用的实用系统都用了某种高级版本的 RNN。 3. 语音…

2023年4月8日
000
tensorflow

TensorFlow for python学习使用

TensorFlow 是由 Google Brain 团队为深度神经网络（DNN）开发的功能强大的开源软件库。当前流行的深度学习框架，从中能够清楚地看到 TensorFlow 的领先地位：二、Ubuntu16.04下安装tensorFlow pip3 install tensorflow 参考文章： ubuntu16.04下安装&配置ana…

2023年4月8日
000
卷积神经网络

卷积神经网络中十大拍案叫绝的操作【转】

原文：https://cloud.tencent.com/developer/article/1038802 CNN从2012年的AlexNet发展至今，科学家们发明出各种各样的CNN模型，一个比一个深，一个比一个准确，一个比一个轻量。我下面会对近几年一些具有变革性的工作进行简单盘点，从这些充满革新性的工作中探讨日后的CNN变革方向。注：水平所限，下面…

2023年4月6日
000
PyTorch

动手学深度学习PyTorch版-task03

课后习题训练集、验证集和测试集的意义https://blog.csdn.net/ch1209498273/article/details/78266558有了模型后，训练集就是用来训练参数的，说准确点，一般是用来梯度下降的。而验证集基本是在每个epoch完成后，用来测试一下当前模型的准确率。因为验证集跟训练集没有交集，因此这个准确率是可靠的。那么为啥还需要…

2023年4月8日
000
使用Aidlux，轻松落地电力巡检AI应用

本项目参考AidLux AI 实战训练营内容，3-4个课时落地AI应用电力线路是电力系统的重要组成部分，它的安全可靠运行直接关系到一个国家经济的稳定发展。电力线路一旦出现故障,则有可能影响到成片区域的供电安全，严重的甚至造成不可估量的损失。因此，预防电力线路故障预防历来是电力系统的一项重要工作。在Aidlux的官方教程中，首先聚焦于电力巡检方案…

人工智能概论 2023年5月6日
000
卷积神经网络

【33】卷积步长讲解(Strided convolutions)

卷积步长（Strided convolutions）卷积中的步幅是另一个构建卷积神经网络的基本操作，让我向你展示一个例子。如果你想用3×3的过滤器卷积这个7×7的图像，和之前不同的是，我们把步幅设置成了2。你还和之前一样取左上方的3×3区域的元素的乘积，再加起来，最后结果为91。只是之前我们移动蓝框的步长是1，现在移动的步长是2，我们让过滤器跳过2个步…

2023年4月5日
000

卷积神经网络CNN公式推导走读

相关文章