图像分割作为计算机视觉的一个方向,广泛应用在各个领域,记录一下学习的过程,以及各个网络的优缺点,不同的地方等。
最流行的方法是FCN,整个分割的流程大致可以看做如下:
FCN顾名思义,全卷机网络,就是把fc层都换做1x1的卷积层,channel等价于fc层的输出个数。
FCN的架构为编码器,和解码器组成,编码器阶段为 卷积+池化的下采样过程, 解码器阶段为卷积+upsampling的过程,最后接上一个1x1的filter进行pixel分类,如下图
上采样的原因: 池化层会丢失图像信息和降低图像分辨率且是不可逆的操作,对图像分割任务有一些影响。上采样可以补足一些图片的信息,但是信息补充的肯定不完全,所以还需要与左边的分辨率比较高的图片相连接起来(直接复制过来再裁剪到与上采样图片一样大小),这就相当于在高分辨率和更抽象特征当中做一个折衷,因为随着卷积次数增多,提取的特征也更加有效,更加抽象。—— jianyuchen23 from zhihu
SegNet的全称是“用于图像分割的深度卷积编码器-解码器架构”
segnet的上采样是做反向 max pooling, 在做下采样的时候,segnet会记录max pooling的index的位置,剩下的部分用0来填充:
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Caffe学习记录(十) SegNet等分割网络学习 - Python技术站