python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

2023年4月8日下午12:19 • PyTorch

程序简介
程序/数据集下载
数据集准备
训练步骤
预测演示步骤

程序简介

图像语义分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。本文提供了一个可进行自定义数据集训练基于pytorch的deeplabv3+图像分割模型的方法，训练了一个动漫人物分割模型，不过数据集较小，仅供学习使用
程序输入：动漫图片
程序输出：分割好的动漫人物图片

deeplabv3+是一种比较流行的图像语义分割模型，本文经过多次实验，对比了deeplabv3+、pspnet和unet，查看效果后，最终选择了deeplabv3+,下图是程序生成结果

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

程序/数据集下载

点击进入下载地址

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

数据集准备

在VOCdevkit/VOC2007/JPEGImages文件夹中，放入原图

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

在VOCdevkit/VOC2007SegmentationClass文件夹中，放入mask图片

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

mask图片虽然看起来是全黑色的，但它实际上是单通道的、像素值记录了分类id的图片，它的本质类似于下图，即每个点都被分类，不同数据集转换得到mask图片的方法不同，所以这一步需要自行处理

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

训练步骤

在voc_annotation.py中，可更换下列参数，其中最值得注意的是RATIO，当这个参数等于[0.1, 0.85]时，如果目标占据整张图片小于10%或者大于85%时，图片会被过滤掉，不被计入数据集

trainval_percent    = 1#参与训练和验证的数据集比例
train_percent       = 0.8#训练集比例
RATIO = [0.1, 0.85]#目标大小不在这个范围会被过滤掉

运行voc_annotation.py，数据集被分割成训练和验证集

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

修改train.py下的参数，本文提供的程序只有基于mobilenet主干网络的预训练模型，相比xception，它更小且性能减少不大，适合大多数人的电脑设备，所以我们主要修改的参数主要如下，其中num_classes是加上背景的分类数，比如本文的分类就是背景、动漫人物，所以是2类，其他参数最好不要改

#-------------------------------#
#   是否使用Cuda
#   没有GPU可以设置成False
#-------------------------------#
Cuda = True
#-------------------------------#
#   训练自己的数据集必须要修改的
#   自己需要的分类个数+1，如2+1
#-------------------------------#
num_classes = 2

运行train.py，可以看到mIOU在一直上升，mIOU可以理解为模型分割部分和正确分割部分的重合程度，是语义分割模型的一个重要指标,最终训练集mIOU为90%，验证集mIOU为84%

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

程序会记录loss，并绘图，在logs/loss文件夹可找到

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

每次迭代，最新模型和最佳模型也会保存在logs文件夹下，last.pth为最新模型，best.pth为最佳模型

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

预测演示步骤

修改deeplab.py中的参数，除了model_path其他参数保证它跟train.py中的一样就行，如果已经是按本文的数据集进行学习的话，不需要修改，logs/best.pth是训练好的模型，本文会提供下载，如果按照上述步骤自行训练，因为模型和数据集较小，使用3070显卡训练只需要2分钟，就算是用CPU，时间也不会太久

_defaults = {
    #----------------------------------------#
    #   model_path指向logs文件夹下的权值文件
    #----------------------------------------#
    "model_path"        : \'logs/best.pth\',
    #----------------------------------------#
    #   所需要区分的类的个数+1
    #----------------------------------------#
    "num_classes"       : 2,
    #----------------------------------------#
    #   所使用的的主干网络：mobilenet、xception    
    #----------------------------------------#
    "backbone"          : "mobilenet",
    #----------------------------------------#
    #   输入图片的大小
    #----------------------------------------#
    "input_shape"       : [400, 400],
    #----------------------------------------#
    #   下采样的倍数，一般可选的为8和16
    #   与训练时设置的一样即可
    #----------------------------------------#
    "downsample_factor" : 16,
    #--------------------------------#
    #   blend参数用于控制是否
    #   让识别结果和原图混合
    #--------------------------------#
    "blend"             : True,
    #-------------------------------#
    #   是否使用Cuda
    #   没有GPU可以设置成False
    #-------------------------------#
    "cuda"              : True,
}

运行predict.py，程序就会提示输入图片，将图片拖入终端回车就能看到图像分割结果

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python调用pytorch实现deeplabv3+图像语义分割——以分割动漫人物为例 - Python技术站

pytorch 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

pytorch 0.4.0迁移指南

上一篇 2023年4月8日下午12:19

pytorch中tensor张量数据基础入门

下一篇 2023年4月8日下午1:04

循环神经网络

什么是循环神经网络——学习笔记

序列模型：以一个句子为例 1 循环网络：通过带有自反馈的神经元，能够处理任意长度的（存在时间关联性）序列；将过去的信息整合起来，辅助处理当前信息。循环网络的结构以及参数循环网络的前向传播的计算简化表示穿越时间反向传播（第一幅图是前向传播计算损失函数，第二幅图是后向传播调整参数） 2 类型：固…

2023年4月8日
000
解决： ./netapp.bin: error while loading shared libraries: libcaffe.so.1.0.0: cannot open shared object file: No such file or directory 运行时报错（caffe）

caffe安装好后lib没有配置到/usr/lib或/usr/local/lib中，需手动配置： export LD_LIBRARY_PATH=/path_to_your_caffe/build/lib/:$LD_LIBRARY_PATH https://github.com/CMU-Perceptual-Computing-Lab/openpose/is…

Caffe 2023年4月8日
000
[论文] 基于轴向注意多尺度时频卷积网络的语音增强算法

[论文] 基于轴向注意多尺度时频卷积网络的语音增强算法本文介绍了ICASSP2022 DNS Challenge和AEC Challenge第一名百度的技术方案。该方案提出了一种信号处理-深度学习混合式方法(hybrid method)，同时抑制回声、噪声和混响。其中信号处理部分利用线性回声消除算法为深度神经网络提供条件信息(conditional inf…

卷积神经网络 2023年4月7日
000
pytorch中的卷积和池化计算方式详解

PyTorch中的卷积和池化计算方式在PyTorch中，卷积和池化是深度学习中非常重要的一部分。在本文中，我们将详细介绍PyTorch中的卷积和池化计算方式，并提供两个示例。示例1：使用PyTorch中的卷积计算方式以下是一个使用PyTorch中的卷积计算方式的示例代码： import torch import torch.nn as nn # Def…

PyTorch 2023年5月16日
000
卷积神经网络 CNN – Dropout

dropout 是神经网络用来防止过拟合的一种方法，很简单，但是很实用。基本思想是以一定概率放弃被激活的神经元，使得模型更健壮，相当于放弃一些特征，这使得模型不过分依赖于某些特征，即使这些特征是真实的，当然也可能是假的。大致步骤 1. 在神经元 H1 被激活后，随机生成一组数据 U1 和一个0-1的随机数 p 　　H1 = np.maximum(0,…

卷积神经网络 2023年4月7日
000
tensorflow

tensorflow for windows –转载

博客来源于http://blog.csdn.net/darlingwood2013/article/details/60322258 安装说明平台：目前可在Ubuntu、Mac OS、Windows上安装版本：提供gpu版本、cpu版本安装方式：pip方式、Anaconda方式 Tips: 在Windows上目前支持python3.5.x gpu版本需…

2023年4月6日
000
目标检测

NeurIPS 2018 | 旷视科技提出MetaAnchor：自定义锚点框优化目标检测系统

论文名称：MetaAnchor: Learning to Detect Objects with Customized Anchors 论文链接：https://arxiv.org/abs/1807.00980 目录导语背景设计思想方法锚点框函数生成器架构细节实验 COCO 目标检测结果结论参考文献导语随着 ImageNet 退出“江湖…

2023年4月8日
000
深度学习Keras框架笔记之Activation类使用

使用 keras.layers.core.Activation(activation) Apply an activation function tothe input.（貌似是把激活函数应用到输入数据的一种层结构） inputshape: 任意。当把这层作为某个模型的第一层时，需要用到该参数（元组，不包含样本轴）。 …

Keras 2023年4月5日
000

合作推广

合作推广

返回顶部