SRCNN 卷积神经网络

2023年4月8日上午3:27 • 卷积神经网络

2019-05-19

从GitHub下载了代码（这里）

代码量虽然不多，但是第一次学，花了时间还是挺多的。根据代码有跑出结果（基本没有改），但是对于数据集的处理还是看的很懵逼，主要是作者的实现都是用类封装，然后调用函数实现，而且每一个代码块没有测试，所以很多代码不知道什么意思，所以，我把能够拆分的进行了拆分，用jupyter重新实现下

一、数据集的理解

在加载成 dataloader 之前应先做预处理

1.对于训练集不是利用RGB训练的，而是使用YCbCr的 Y 通道

SRCNN 卷积神经网络

2.将训练集图像利用torchvision.transforms 里的 Resize 缩小到 128*128的大小，此时图像会变模糊

（论文中用双三次插值，所以我一直在代码中找这个，没想到用了Resize）

训练图：

Compose(
    CenterCrop(size=(256, 256))
    Resize(size=128, interpolation=PIL.Image.BILINEAR)
    ToTensor()
)

标签：

Compose(
    CenterCrop(size=(256, 256))
    ToTensor()
)

SRCNN 卷积神经网络

3.构建dataloader（）

4.前向传播

nn.Conv2d(in_channels=num_channels, out_channels=base_filter, kernel_size=9, stride=1, padding=4, bias=True),
            nn.ReLU(inplace=True),
            nn.Conv2d(in_channels=base_filter, out_channels=base_filter // 2, kernel_size=1, bias=True),
            nn.ReLU(inplace=True),
            nn.Conv2d(in_channels=base_filter // 2, out_channels=num_channels * (upscale_factor ** 2), kernel_size=5, stride=1, padding=2, bias=True),
            nn.PixelShuffle(upscale_factor)

SRCNN 卷积神经网络

5.利用（1,1,256,256）的输出和标签做了loss

6.经过20代迭代

===> Epoch 20 starts:
 200/200 [================================================================================>]  Step: 151ms | Tot: 29s948ms | Loss: 0.0034
    Average Loss: 0.0034
 100/100 [================================================================================>]  Step: 92ms | Tot: 8s353ms | PSNR: 25.9508
    Average PSNR: 25.9508 dB

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：SRCNN 卷积神经网络 - Python技术站

人工智能卷积神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

全卷积网络FCN详解

上一篇 2023年4月8日上午3:26

相关与卷积（数字信号处理）的数学原理及 Python 实现

下一篇 2023年4月8日上午3:27

配置caffe过程中，生成解决方案出错。无法打开包括文件: “gpu/mxGPUArray.h”

—— 已启动生成: 项目: matcaffe, 配置: Release x64 ——12> MatlabPreBuild.cmd : Create output directories for matlab scripts.12> caffe_.cpp12>..\..\matlab\+caffe\private\caffe_…

Caffe 2023年4月6日
000
Caffe

基于深度学习的人脸识别系统系列（Caffe+OpenCV+Dlib）——【六】设计人脸识别的识别类

前言基于深度学习的人脸识别系统，一共用到了5个开源库：OpenCV（计算机视觉库）、Caffe（深度学习库）、Dlib（机器学习库）、libfacedetection（人脸检测库）、cudnn（gpu加速库）。用到了一个开源的深度学习模型：VGG model。最终的效果是很赞的，识别一张人脸的速度是0.039秒，而且最重要的是：精度高啊！！！ CPU：…

2023年4月8日
000
tensorflow

Dive into TensorFlow系列（2）- 解析TF核心抽象op算子

本文作者：李杰 TF计算图从逻辑层来讲，由op与tensor构成。op是项点代表计算单元，tensor是边代表op之间流动的数据内容，两者配合以数据流图的形式来表达计算图。那么op对应的物理层实现是什么？TF中有哪些op，以及各自的适用场景是什么？op到底是如何运行的？接下来让我们一起探索和回答这些问题。一、初识op 1.1 op定义 op代表计算图中的节…

2023年4月8日
000
PyTorch

PyTorch——(3) tensor基本运算

@ 目录矩阵乘法 tensor的幂 exp()/log() 近似运算 clamp() 截断 norm() 范数 max()/min() 最大最小值 mean() 均值 sun() 累加 prod() 累乘 argmax()/argmin() 最大最小值所在的索引 topk() 取最大的n个 kthvalue() 第k个小的值比较运算矩阵乘法只对2d矩…

2023年4月8日
000
循环神经网络

超生动图解LSTM和GRU，一文读懂循环神经网络！

作者 Michael Nguyen王小新编译自 Towards Data Science量子位出品 | 公众号 QbitAI AI识别你的语音、回答你的问题、帮你翻译外语，都离不开一种特殊的循环神经网络（RNN）：长短期记忆网络（Long short-term memory，LSTM）。最近，国外有一份关于LSTM及其变种GRU（Gated Recur…

2023年4月8日
000
Caffe_SSD训练模型错误集锦及相关解决方法

1. No module named _caffe import caffeTraceback (most recent call last):File “”, line 1, in File “caffe/init.py”, line 1, in from .pycaffe import Net, SGDSolver, NesterovSolver, Ad…

Caffe 2023年4月5日
000
机器学习第一练（铁达尼号罹难者预测）

之前一直觉得这个机器学习就是把一堆数据扔给机器（代码）然后它能产生出新的神奇来，不过很多事情只有做了才能了解它大概是个什么东西首先去Kaggle上找数据，一般数据挖掘这块，基本上至少有一个训练集和一个测试集，下载这个train和test文件，是不是觉得很熟悉，这跟KNIME做决策树，贝叶斯的数据挖掘的流程很相似网站上还有关于数据的一个解释，显示…

机器学习 2023年4月11日
000
Pytorch从一个输入目录中加载所有的PNG图像，并将它们存储在张量中

1 import os 2 import imageio 3 from imageio import imread 4 import torch 5 6 # batch_size = 3 7 # batch = torch.zeros(batch_size, 3, 256, 256, dtype=torch.uint8) 8 # batch.shape #t…

PyTorch 2023年4月7日
000

合作推广

合作推广

返回顶部