caffe生成voc格式lmdb

2023年4月5日下午9:16 • Caffe

要训练ssd基本都是在liu wei框架下改，生成lmdb这一关照葫芦画瓢总遇坑，记录之：

1. labelmap_voc.prototxt要根据自己的分类修改，比如人脸检测改成这样：

item {
  name: "none_of_the_above"
  label: 0
  display_name: "background"
}
item {
  name: "face"
  label: 1
  display_name: "face"
}

这里只有两类：背景、脸，因此训练的时候也要记得num_classes改成2（20分类的voc是21）

2. 路径一定要写对，确认路径写对的情况下如果还是报找不到的错可能是字符问题。

解决方案是在两行sed中间加上一行：

 sed -i "s/^/$name\/JPEGImages\//g" $img_file                                     
 sed -i 's/^M//g' $img_file                                                       
 sed -i "s/$/.jpg/g" $img_file

其中^M不是键盘直接输入的，是ctrl+v ctrl+M连续输入

3. 默认是jpg格式文件，如果是png，需要改两个地方：

creat_list.sh里：

sed -i "s/$/.jpg/g" $img_file

creat_data.sh

extra_cmd="--encode-type=jpg --encoded"

剩下的可能就是xml格式不对，比如<name>face<name>等处在生成xml时候搞错了;

执行creat_data.sh时经常会报bounding box irregular，不知道对结果有什么影响，能用。

-------------------------------------------------------------------------

faster rcnn给了python脚本处理，在./lib/dataset目录下，所以不用提前生成lmdb，把pascal_voc格式的数据拷贝到./data/VOCdevkit2007目录下即可，参考这里修改基本上可以满足训练要求。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：caffe生成voc格式lmdb - Python技术站

Caffe 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Caffe windows编译找不到python27_d.lib问题解决

上一篇 2023年4月5日

Win10上使用VS2015编译Caffe2

下一篇 2023年4月5日

卷积神经网络

深度卷积网络-Inception系列

主要列举的网络结构有： Inception V1: Going Deeper with Convolutions Inception V2: Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift Inception V3: …

2023年4月6日
000
PyTorch

文本分类（六）：不平衡文本分类，Focal Loss理论及PyTorch实现

转载于：https://zhuanlan.zhihu.com/p/361152151 转载于：https://www.jianshu.com/p/30043bcc90b6 摘要：本篇主要从理论到实践解决文本分类中的样本不均衡问题。首先讲了下什么是样本不均衡现象以及可能带来的问题；然后重点从数据层面和模型层面讲解样本不均衡问题的解决策略。数据层面主要通过欠采样…

2023年4月6日
000
人工智能概论

人工智能导论：关于人工智能你需要知道的一切

人工智能能成为当今行业的流行语，这是有充分原因的。人工智能已经在技术领域取得了很大的进步，与此同时，我国人工智能领域的人才缺口也在不断扩大。据新华社报道，百度与浙江大学近日发布的《中国人工智能人才培养白皮书》显示，目前人工智能行业人才缺口高达500万，并且在高度跨学科复合型人才的标准下，人才短缺将会长期存在。所以现阶段，尤其是大学生，如果你想要涉足人工智能…

2022年11月22日
200
Keras

keras 训练中的Acc由来

What does the train accuracy mean? What are the test samples? 第一个回答 site: https://github.com/keras-team/keras/issues/877 第二个回答这里对于training accuracy的描述分个，我更偏向第二种，是针对一个batch (默认32)，…

2023年4月8日
000
Keras

keras—多层感知器MLP—IMDb情感分析

1 import urllib.request 2 import os 3 import tarfile 4 from keras.datasets import imdb 5 from keras.preprocessing import sequence 6 from keras.preprocessing.text import Tokenizer 7…

2023年4月5日
000
卷积神经网络

theano学习指南4（翻译）- 卷积神经网络

动机卷积神经网络是一种特殊的MLP,这个概念是从生物里面演化过来的. 根据Hubel和Wiesel早期在猫的视觉皮层上的工作 [Hubel68], 我们知道在视觉皮层上面存在一种细胞的复杂分布,这些细胞对一些局部输入是很敏感的,它们被成为感知野, 并通过这种特殊的组合方式来覆盖整个视野. 这些过滤器对输入空间是局部敏感的,因此能够更好得发觉自然图像中不同物…

2023年4月8日
000
caffe binaryproto 与 npy相互转换的实例讲解

下面是关于“caffe binaryproto 与 npy相互转换的实例讲解”的完整攻略。问题描述在深度学习中，我们通常需要将数据保存为二进制文件，以便于在不同的平台上进行数据传输和处理。那么，在caffe中，如何将数据保存为binaryproto文件，并将其转换为npy文件？反之，如何将npy文件转换为binaryproto文件？解决方法以下是将数…

Caffe 2023年5月16日
000
Python+OpenCV+pyQt5录制双目摄像头视频的实例

下面是关于“Python+OpenCV+pyQt5录制双目摄像头视频的实例”的完整攻略。背景在Python中，我们可以使用OpenCV库来处理图像和视频。在本文中，我们将介绍如何使用Python+OpenCV+pyQt5录制双目摄像头视频的实例。解决方案以下是Python+OpenCV+pyQt5录制双目摄像头视频的详细步骤：步骤一：导入必要的库 …

Caffe 2023年5月16日
000

合作推广

合作推广

返回顶部