1. 数据集
MNIST手写体数据.bmp图片:训练集60K张28*28的,测试集10K张28*28的;
训练集:
测试集:
下载地址:
2. 读取图片名称与标签,保存到trainlist.txt与testlist.txt
matlab代码:
(1)读取train
改为自己的数据url
clc %% 读取文件夹里的图片名称,且将图片名保存到txt file_path = 'D:deeptoolscaffe-windows-masterdatamnisttrain-images'; img_path_list = dir(strcat(file_path,'*.bmp')); img_num = length(img_path_list); fp = fopen('train.txt','wt'); if img_num > 0 %有满足条件的图像 for j = 1:img_num %逐一读取图像 image_name = img_path_list(j).name;% 图像名 fprintf(fp,'%s %dn',image_name,str2num(image_name(1))); % csvwrite('train.txt',image_name) % image = imread(strcat(file_path,image_name)); % fprintf('%d %d %sn',i,j,strcat(file_path,image_name));% 显示正在处理的图像名 %图像处理过程 省略 end end
结果(部分)是:
(2)val代码
改为自己的test数据URL;
clc %% 读取文件夹里的图片名称,且将图片名保存到txt file_path = 'D:deeptoolscaffe-windows-masterdatamnistt10k-images'; img_path_list = dir(strcat(file_path,'*.bmp')); img_num = length(img_path_list); fp = fopen('test.txt','wt'); if img_num > 0 %有满足条件的图像 for j = 1:img_num %逐一读取图像 image_name = img_path_list(j).name;% 图像名 fprintf(fp,'%s %dn',image_name,str2num(image_name(1))); % csvwrite('train.txt',image_name) % image = imread(strcat(file_path,image_name)); % fprintf('%d %d %sn',i,j,strcat(file_path,image_name));% 显示正在处理的图像名 %图像处理过程 省略 end end
部分结果为:
(3) test代码
改为自己的test数据URL;
clc %% 读取文件夹里的图片名称,且将图片名保存到txt file_path = 'D:deeptoolscaffe-windows-masterdatamnistt10k-images'; img_path_list = dir(strcat(file_path,'*.bmp')); img_num = length(img_path_list); fp = fopen('test.txt','wt'); if img_num > 0 %有满足条件的图像 for j = 1:img_num %逐一读取图像 image_name = img_path_list(j).name;% 图像名 fprintf(fp,'%sn',image_name); % csvwrite('train.txt',image_name) % image = imread(strcat(file_path,image_name)); % fprintf('%d %d %sn',i,j,strcat(file_path,image_name));% 显示正在处理的图像名 %图像处理过程 省略 end end
结果为:
3. 现在将数据转变为lmdb格式储存
(1)我们新建一个train_lmdb文件夹(反正是如果我不事先建立这个文件夹就会出错,如下图)
和一个convert.bat文件,里面写入
D:/deeptools/caffe-windows-master/bin/convert_imageset.exe --shuffle D:/deeptools/caffe-windows-master/data/mnist/train-images/ D:/deeptools/caffe-windows-master/examples/mymnist/train.txt D:/deeptools/caffe-windows-master/examples/mymnist/train_lmdb pause
我们使用了--shuffle:意思是随机打乱图片顺序
结果是在新建的train_lmdb文件夹里新生成了这两个文件:
为了确定你成功了,最好看一下生成的log文件夹里以INF开头的看看里面的图片总数是不是你的图片数量。
(2)同上一样得到val_lmdb
4.求得均值——
图片减去均值后,再进行训练和测试,会提高速度和精度。因此,一般在各种模型中都会有这个操作。
那么这个均值怎么来的呢,实际上就是计算所有训练样本的平均值,计算出来后,保存为一个均值文件,在以后的测试中,就可以直接使用这个均值来相减,而不需要对测试图片重新计算。
新建ComputeImageMean.bat,里面输入
D:/deeptools/caffe-windows-master/bin/compute_image_mean.exe D:/deeptools/caffe-windows-master/examples/mymnist/train_lmdb D:/deeptools/caffe-windows-master/examples/mymnist/mean.binaryproto
pause
结果:
至于转换成leveldb格式和用这个格式求均值都可以从我的另一篇看到。。
5.现在我们仔细编写一下solve.prototxt与train_test.prototxt
因操作失误,现在链接不上远程 待续。。。。。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:windows+caffe(五)——实例2MNIST图片 - Python技术站