tensorflow slim实现resnet_v2

2023年4月6日上午1:05 • tensorflow

resnet_v1: Deep Residual Learning for Image Recognition

tensorflow slim实现resnet_v2

Conv--> bn--> relu

对于上面 7x7卷积和maxpooling,注意这个卷积是不能进行bn和relu的，因为version2的顺讯是 bn->relu->conv所以 bn和relu要留到conv2层

tensorflow slim实现resnet_v2

stack_blocks_dense是把4个block都进行展开，最后一个block后要进行额外的 bn->relu reduce_mean([1,2])表示 [batch_size, 7,7,2048] 变成 [batch_size,1,1,2048] 每个7x7进行取均值

tensorflow slim实现resnet_v2

??最后一个为什么stride是1,因为不需要downsampling,代替的是average pool

bottleneck结构如下： {because of concerns on the training time that we can afford,所以改成了bottleneck结构}

一下两个结构有相同的复杂度，但是发下左边的维度是64 右边是256 其实就是4倍的关系

resnet_v2 : Identity Mappings in Deep Residual Networks

tensorflow slim实现resnet_v2

(a)就是第一篇论文采取的结构

这篇文章侧重在想创造一条直接的通路用来传播信息，不仅仅是在一个残差单元内，而是考虑在整个网络中。

tensorflow slim实现resnet_v2

论文发现当h(x)和f(y)都是自映射，信号能直接传播到下个单元，无论是前向传播或是后向传播，所以设计了上图(b)的结构

实验发现h(x)使用1x1卷积或者gate 都不如直接自映射得到的结果好

由post-activation 变成了 pre-activation 之前是relu在conv后，现在relu在conv前

tensorflow slim实现resnet_v2

tensorflow slim实现resnet_v2

(1) 任何一层的输出都可以由之前某个底层的输出及一个残差结构表示

(2) tensorflow slim实现resnet_v2

任何一层的输出都可以由原始输入和到它的所有残差输出之和表示，而以前的网络都是层与层的积表示

(3) 对loss求导发现

　　 tensorflow slim实现resnet_v2

求和那项不会永远都为-1，所以梯度不会弥散 vanish, 即使当weights任意小的时候

对比了不同的shortcut方式，发现就是简单的identity比较好，1x1conv效果更差，可以用来对不同维度的数据进行处理

对比了不同的relu,bn，conv的组合方式，发现以下的full pre-activation的结构效果最好

tensorflow slim实现resnet_v2

tensorflow slim实现resnet_v2

Appendix:

tensorflow slim实现resnet_v2

对于第一个residual结构的输入，因为前面是一个单独的conv层，我们需要对conv层的结果进行activation

对于最后一个residual结构，在addition之后要额外进行一个activation

以上为论文解读。接下来是代码实现。

代码实现

def resnet_v2_50:

　　block = ......

　　return resnet_v2(block)

def resnet_v2():

　　net = conv2d(64,6,stride=2, scope="conv1")

　　net = max_pool2d(net, [3,3] stride=2, scope="pool1")

　　net = stack_blocks_dense(blocks)

　　net = batch_norm(net, activation_fn=tf.nn.relu, scope="postnorm")

　　return net

def stack_blocks_dense(blocks):

　　for block in blocks:

　　　　bottlenect(block)

def bottleneck(block): #图如下

　　preact = batch_norm(inputs, tf.nn.relu)

　　if depth_in == depth: #当残差结构输入的维度和经过block的维度一样的话

　　　　shortcut = subsample(inputs, stride) #只需要进行downsampling

　　else:

　　　　shortcut = conv2d(preact,depth,[1,1],stride,normalizer_fn=None,activation_fn=None)

　　residual = conv2d(preact, depth_bottleneck, [1,1],stride=1)

　　residual = conv2d_same(residual, depth_bottleneck, 3,stride)

　　residual = conv2d(residual, depth,[1,1],stride=1,normalizer_fn=None,activation_fn=None)

　　output = shortcut + residual

　　return output

　 tensorflow slim实现resnet_v2

　

　　

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：tensorflow slim实现resnet_v2 - Python技术站

tensorflow 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

tensorflow联邦学习框架整理

上一篇 2023年4月6日

tensorflow module data读取数据方式

下一篇 2023年4月6日

PyTorch错误解决：XXX is a zip archive(did you mean to use torch.jit.load()?)

错误原因：训练保存模型时，torch的版本是1.6.0（使用torch.__version__可以查看torch的版本号）而加载模型时，torch的版本号低于1.6.0 解决方案： If for any reason you want torch.save to use the old format, pass the kwarg _use_new_…

PyTorch 2023年4月7日
000
Caffe

Caffe Ubuntu14.04 64位的最快安装（cuda7.5 + cudnn7.0 2016最新）

最近因为各种原因，装过不少次Caffe，安装过程很多坑，为节省新手的时间，特此总结整个安装流程。关于Ubuntu 版本的选择，建议用14.04这个比较稳定的版本，但是千万不要用麒麟版！！！比原版体验要差很多！！！ Caffe的安装过程，基本采纳这篇文章然后稍作改动，跳过大坑。 Caffe + Ubuntu 14.04 64bit + CUDA 6.5 …

2023年4月8日
000
Keras Mask 实验总结（原创）

Conclusion: Mask 是创造了一个 mask 矩阵，随着每一层的结果 tensor 一起逐层传递，如果之后某一层不能接受 mask 矩阵则会报错 Embedding， mask_zero 有效 Concatenate， Dense 层之前可以有 Masking 层，虽然从 tensor output 输出来看似乎 mask 矩阵没有作用，但是相…

Keras 2023年4月8日
000
图像处理之基础—二维卷积c实现

http://wenku.baidu.com/link?url=4RzdmvP9sdaaUbnVEW4OyBD-g67wIOiJjKFF3Le_bu7hIiBS7I6hMcDmCXrQwsHvrsPvR4666J1qF1ff5JVvd2xL8rzL9N81qvL-1dwkiim 特别说明一下，根据那本书所说，这算的是线性卷积。还有种卷积叫循环卷积。（1）…

卷积神经网络 2023年4月8日
000
keras使用多进程

最近在工作中有一个需求：用训练好的模型将数据库中所有数据得出预测结果，并保存到另一张表上。数据库中的数据是一篇篇文章，我训练好的模型是对其中的四个段落分别分类，即我有四个模型，拿到文本后需要提取出这四个段落，并用对应模型分别预测这四个段落的类别，然后存入数据库中。我是用keras训练的模型，backend为tensorflow，因为数据量比较大，自然想到用多…

Keras 2023年4月8日
000
pytorch官网上两个例程

caffe用起来太笨重了，最近转到pytorch，用起来实在不要太方便，上手也非常快，这里贴一下pytorch官网上的两个小例程，掌握一下它的用法：例程一：利用nn 这个module构建网络，实现一个图像分类的小功能；链接：http://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.ht…

PyTorch 2023年4月8日
000
循环神经网络

循环神经网络(三)-RNN进阶

这部分许多内容要类比CNN来进行理解和解释，所以需要对CNN比较熟悉。 RNN的特点 1. 权值共享 CNN权值共享，RNN也有权值共享，在入门篇可以看到RNN结构图中，权重使用的是同样的字母为什么要权值共享 a. 减少weight，减少计算量，这点其实比较好理解。试想10X10的输入，全连接隐藏层如果是1000个神经元，那就有100000个weig…

2023年4月5日
000
PyTorch

【笔记】PyTorch框架学习 — 2. 计算图、autograd以及逻辑回归的实现

1. 计算图使用计算图的主要目的是使梯度求导更加方便。 import torch w = torch.tensor([1.], requires_grad=True) x = torch.tensor([2.], requires_grad=True) a = torch.add(w, x) # retain_grad() b = torch.add(w,…

2023年4月8日
000

合作推广

合作推广

返回顶部