caffe-ssd 训练自己的VOC数据集(一):转换VOC xml数据为lmdb格式

2023年4月8日下午1:38 • Caffe

假设你已经做好了VOC数据标签，也就是xml文件，并且已经配置好了caffe-ssd的环境

第一步，在caffe-ssd/data目录下本身自带有如下文件夹：

然后在caffe-ssd/data目录下新建一个文件夹命名为VOCdevkit:

然后data目录下有：

进入VOCdevkit目录内，新建VOC2007文件夹，然后再进入VOC2007文件夹内新建Annotations,ImageSets,JPEGImages三个文件夹，在ImageSets文件夹内新建一个Main文件夹

最后目录级别为：

caffe-ssd/data/VOCdevkit/VOC2007
-----------------------------------------------/Annotations
-----------------------------------------------/ImageSets
--------------------------------------------------------------/Main
-----------------------------------------------/JPEGImages

再将自己做的数据集所有的jpg图片全部放入JPEGImages文件夹内（下面这张路径图是windows可视之后。只是为了方便理解，我这篇博客是基于LINUX下的，Windows下应该也差不多）

将自己做的数据集标签（应该和放入JPEGImages文件内的图片名一样且数量一样多）xml文件全部放入Annotations文件夹内

Main文件夹应该有（可以用matlab脚本或者python脚本生成，我会将matlab脚本放置在下边百度云盘连接内）：

下载地址：https://pan.baidu.com/s/1SmBjDglt8-7edC1tmEE7QQ 密码：0m27

训练集： train.txt

训练验证集： trainval.txt

测试集： test.txt

验证集： val.txt

这些txt文件内容如下所示，记录的都是数据集的名字不包括后缀：

好了，准备好以上工作后要正式开始将我们的VOC数据集转换为lmdb格式的工作了。

1. 首先看到caffe-ssd/data目录下，其中有我们新建的VOCdevkit文件夹还有一个VOC0712文件夹：

进入VOC0712文件夹内，可以看到：

create_data.sh, create_list.sh, labelmap_voc.prototxt三个文件

create_list.sh: 用于生成训练集，测试集的文件路径txt文件和一个测试集目录名和图片大小的txt

create_data.sh: 用于生成lmdb格式的训练数据集和测试集

labelmap_voc.prototxt: 里头是标签的信息

将这三个文件复制到自己新建的VOCdevkit/VOC2007文件夹内：复制后VOC2007文件夹内文件如下

然后要准备修改复制过来的这三个文件

首先修改create_list.sh（改成自己的目录就行）

总共需要改三处。

然后改create_data.sh（改成自己的目录就行）

总共需要修改五处。

最后修改labelmap_voc.prototxt文件：

除了第一个背景标签部分不要改，其他改成自己的标签就行，多的删掉，少了添加进去就行

最后，再在caffe-ssd/examples文件夹内新建一个VOC2007文件夹就行（空的）：新建后examples目录内文件如下：

2. 要开始生成lmdb的最后步骤了

先运行create_list.sh脚本用sh create_list.sh命令不行的话，就用 . create_list.sh命令，运行完后，会在自己建的VOCdevkit/VOC2007目录内生成trainval.txt, test.txt, test_name_size.txt。

再运行create_data.sh脚本用 sh create_data.sh 命令不行的话，就用 . create_data.sh 命令，运行完后，会在会在自己建的VOCdevkit/VOC2007目录内生成lmdb文件夹：

lmdb文件夹内有：

这两个文件夹内有训练集和测试集的lmdb格式的数据：

例如测试集lmdb文件夹内：

到此，VOC数据集转换为lmdb格式数据集就成功了。双击666!!!

关于利用lmdb数据训练ssd，之后再更，请见 caffe-ssd 训练自己的VOC数据集(二):训练生成的lmdb数据

阅读剩余 65%

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：caffe-ssd 训练自己的VOC数据集(一):转换VOC xml数据为lmdb格式 - Python技术站

Caffe 人工智能

0 0 打赏

微信扫一扫

支付宝扫一扫

Caffe框架GPU与MLU计算结果不一致请问如何调试？

上一篇 2023年4月8日下午1:37

【caffe】基于CNN的年龄和性别检测

下一篇 2023年4月8日下午1:39

TensorFlow开发流程 Windows下PyCharm开发+Linux服务器运行的解决方案

不知道是否有许多童鞋像我一样，刚开始接触TensorFlow或者其他的深度学习框架，一时间有一种手足无措的感觉。怎么写代码？本机和服务器的关系是啥？需要在本机提前运行吗？怎么保证写的代码是对的？？？真的对这些问题毫无概念，一头雾水，毕竟作为VS的重度依赖用户，早已习惯了在一个IDE里解决所有的问题。多方查阅资料加上组里同学热情的指导，终于知道大佬们是怎么做的…

tensorflow 2023年4月8日
000
Keras

keras API的使用，神经网络层，优化器，损失函数，查看模型层数，compile和fit训练

layers介绍 Flatten和Dense介绍优化器损失函数 compile用法第二个是onehot编码模型训练 model.fit 两种创建模型的方法 from tensorflow.python.keras.preprocessing.image import load_img,…

2023年4月6日
000
循环神经网络

莫烦python|Tensorflow笔记–什么是循环神经网络RNN

我们在想象现在有一组数据序列，Data0，Data1,Data2,Data3，预测Results0的时候基于Data0，同意在预测其他结果的时候也是基于其他的数字。每次使用的神经网络都是同一个NN。如果这些数据是有关联顺序的，那么就要遵从它们之间的顺序，否则就串位了。但是普通的神经网络结构并不能让NN了解这些数据之间的关联。那么我们如何让数据间的关联也被N…

2023年4月8日
000
机器学习：Python中如何使用最小二乘法

之所以说”使用”而不是”实现”，是因为python的相关类库已经帮我们实现了具体算法，而我们只要学会使用就可以了。随着对技术的逐渐掌握及积累，当类库中的算法已经无法满足自身需求的时候，我们也可以尝试通过自己的方式实现各种算法。言归正传，什么是”最小二乘法”呢？定义：最小二乘法（又称最小平方法）是一种数学优化技术，它通过最小化误差的…

机器学习 2023年4月10日
000
Keras

迁移学习：keras + vgg16 + cifar10 实现图像识别

框架：keras数据集：CIFAR10模型：vgg16注：vgg16模型的输入图像尺寸至少为 48*48 思路：去掉vgg16的顶层，保留其余的网络结构与训练好的权重。然后添加模型结构，进而训练CIFAR10。 1.模型结构 2.具体代码以及注释 ①训练代码 #-*- coding: utf-8 -*- #迁移学习，vgg16+cifar10 from ke…

2023年4月8日
000
tensorflow

深入浅出TensorFlow（二）：TensorFlow解决MNIST问题入门

2017年2月16日，Google正式对外发布Google TensorFlow 1.0版本，并保证本次的发布版本API接口完全满足生产环境稳定性要求。这是TensorFlow的一个重要里程碑，标志着它可以正式在生产环境放心使用。在国内，从InfoQ的判断来看，TensorFlow仍处于创新传播曲线的创新者使用阶段，大部分人对于TensorFlow还缺乏了解…

2023年4月8日
000
卷积神经网络

【TensorFlow实战】TensorFlow实现经典卷积神经网络之VGGNet

　　VGGNet是牛津大学计算机视觉组与Google DeepMind公司的研究员一起研发的深度卷积神经网络。VGGNet探索了卷积神经网络的深度与其性能之间的关系，通过反复堆叠3*3的小型卷积核核2*2的最大池化层，VGGNet成功地构建了16~19层的卷积神经网络。VGGNet相比于之前state-of-the-art网络结构，错误率大幅下降，并取得了I…

2023年4月8日
000
Keras

win10 + python3.6 + VSCode + tensorflow-gpu + keras + cuda8 + cuDN6N环境配置

写在前面的话：　　再弄这个之前，我对python也好，tensorflow也好几乎是0认知的，所以配置这个环境的时候，走了不少弯路，整整耗费了一个星期的时间才搭配完整这个环境，简直了。。。然而最气的是，好不容易搭好了环境，因为我笔记本配置低，老师给的程序根本跑不起来。　　这个环境搭配的教程有很多博客可以参考，我却弄了很久也没成功，反思自己，是自大的心理在…

2023年4月8日
000

caffe-ssd 训练自己的VOC数据集(一):转换VOC xml数据为lmdb格式

相关文章

分享到: