何凯明大神最近出的Group Normalization,文章中就自带了TF的实现代码,非常简洁,但是对于少数还在不得不使用caffe的人来说还得自己手动推导BP公式,网上找了很久都没有找到,此处花了一些时间推了一下,欢迎指正。
实际上推导出来后才发现GN的反向传播和Instance Norm基本一样,区别仅仅在于最后求Mean的范围,IN是针对一个channel进行求解,GN则是在一个group内进行求解,IN也可以看成s=1的GN。
caffe实现代码可以参考Instance Normalization的实现,只需略微修改一点即可。这里也有一份别人的实现(感谢他的分享),但因为他使用的是自己公司的框架,所以仅供参考。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Group Normalization 反向传播 BP推导(适用于caffe实现) - Python技术站