cifar10训练实例

1. 下载数据

# sudo sh data/cifar10/get_cifar10.sh

2. 转换数据格式为lmdb

# sudo sh examples/cifar10/create_cifar10.sh

转换成功后,会在 examples/cifar10/文件夹下生成两个文件夹,cifar10_train_lmdb和cifar10_test_lmdb, 里面的文件就是我们需要的文件。

caffe训练数据流程

3. 配置solver.prototxt文件

为了节省时间,我们进行快速训练(train_quick),训练分为两个阶段,第一个阶段(迭代4000次)调用配置文件cifar10_quick_solver.prototxt, 学习率(base_lr)为0.001

第二阶段(迭代1000次)调用配置文件cifar10_quick_solver_lr1.prototxt, 学习率(base_lr)为0.0001(越是训练到最后,就需要更高的精度,loss才能趋近稳定)

caffe训练数据流程
base_lr: 0.001
momentum: 0.9
weight_decay: 0.004
lr_policy: "multistep"
gamma: 0.1
stepvalue: 4000
stepvalue: 5000
caffe训练数据流程

原文将两个过程配置文件合并到一起。

最后在当前目录下生成model文件,之后我们就可以用model文件来测试数据了。

原文使用cadu+cudnn加速,运行时间45秒,我用cpu运行了一个小时。5w张图片,1小时,差了80倍的速度。想想都可怕,由此可见GPU 加速的必要性。