目标检测框架py-faster-rcnn修改anchor_box

2023年4月6日上午11:09 • 目标检测

众所周知，anchor_box控制了回归框的大小，我们有时候检测的是大物体或小物体时，需要调整回归框的大小的时候，得改一下anchor_box。
基于rgb公开的py-faster-rcnn修改anchor_box的步骤有一下几步：
1、修改py-faster-rcnn-my/lib/rpn下的三个文件：
1）generate_anchors.py。将以下两行修改成你想要的模样，然后执行这个文件，记下
执行后得到的结果的len。记anchor_box的个数。默认设置得到的是9个。因为是3个scale,3个ratios，从而得到的anchor_box的尺寸一共9种。
#def generate_anchors(base_size=6, ratios=[0.5, 1, 2],
# scales=2**np.arange(3, 6)):

2）修改anchor_target_layer.py中的这一行：
anchor_scales = layer_params.get('scales', (8, 16, 32))
这个（8,16,32)是根据1）中scales生成的，2**np.arange(3, 6)即2的3 4 5次方，
3）修改proposal_layer.py中的这一行：
anchor_scales = layer_params.get('scales', (8, 16, 32))
这个与2）类似。

2、修改train.prototxt和test.prototxt。这两个文件的修改方法类似，我们就写其中一个：

layer {
name: "rpn_cls_score"
type: "Convolution"
bottom: "rpn/output"
top: "rpn_cls_score"
param { lr_mult: 1.0 }
param { lr_mult: 2.0 }
convolution_param {
    #num_output: 18   # 2(bg/fg) * 9(anchors)
#根据你的anchor_box的个数修改。如果你第一步得到的尺寸是8个，那么这里就是16
    kernel_size: 1 pad: 0 stride: 1
    weight_filler { type: "gaussian" std: 0.01 }
    bias_filler { type: "constant" value: 0 }
}
}

layer {
name: "rpn_bbox_pred"
type: "Convolution"
bottom: "rpn/output"
top: "rpn_bbox_pred"
param { lr_mult: 1.0 }
param { lr_mult: 2.0 }
convolution_param {
    #num_output: 36   # 4 * 9(anchors)
#同上，修改为anchors的尺寸个数的4倍。
    kernel_size: 1 pad: 0 stride: 1
    weight_filler { type: "gaussian" std: 0.01 }
    bias_filler { type: "constant" value: 0 }
}
}
layer {
name: 'rpn_cls_prob_reshape'
type: 'Reshape'
bottom: 'rpn_cls_prob'
top: 'rpn_cls_prob_reshape'
#reshape_param { shape { dim: 0 dim: 18 dim: -1 dim: 0 } }
#修改dim的第二个为 2×anchor_box的个数

}