均值是所有训练样本的均值,减去之后再进行训练会提高其速度和精度。

1、caffe下的均值

数据格式是二进制的binaryproto,作者提供了计算均值的文件compute_image_mean,

计算均值时调用:

sudo build/tools/compute_image_mean examples/mnist/mnist_train_lmdb examples/mnist/mean.binaryproto

 生成的均值文件保存在mean_binaryproto。

2、python格式下的均值(.npy)

     需要首先将其转为二进制的,然后再转成python格式下的,用一个python脚本来实现。

#!/usr/bin/env python
import numpy as np
import sys,caffe

if len(sys.argv)!=3:
    print "Usage: python convert_mean.py mean.binaryproto mean.npy"
    sys.exit()

blob = caffe.proto.caffe_pb2.BlobProto()
bin_mean = open( sys.argv[1] , 'rb' ).read()//读入mean.binaryproto
blob.ParseFromString(bin_mean)//解析文件内容到blob
//将blob中的均值转化为.py格式,array的shape(mean_number,channel,height,width)
arr = np.array( caffe.io.blobproto_to_array(blob) )
//选择其中一组均值(?),保存
npy_mean = arr[0]
np.save( sys.argv[2] , npy_mean )

 

将其保存为convert_mean.py,调用

sudo python convert_mean.py mean.binaryproto mean.npy

 得到python下的文件mean.npy

 参考:http://www.cnblogs.com/denny402/p/5102328.html

          http://blog.csdn.net/hyman_yx/article/details/51732656

 

3、caffe.proto

     在2中,出现了caffe.proto,其中定了很多结构化的数据,比如conv层啊,pool层啊。Protobuf是用于数组存储和交换的,

比如一部分写数据进行存储,另一部分进行读写,为了方便操作,将其定义共同的结构化据。

具体可参考:http://blog.csdn.net/qq_16055159/article/details/45115359/