【图像处理】U-Net中的重叠-切片(Overlap-tile)

更新时间:2023-07-15 00:10:29 阅读: 评论:0

【图像处理】U-Net中的重叠-切⽚(Overlap-tile)
Date: 2020/10/19
Coder: CW
2017年高考数学全国卷Foreword:
domesticateOverlap-tile 这种策略,因此当时不太理解为何⽹络结构要设计成⾮对称形式,即上采样得到
上采样得到U-Net 的时候并不知道原作使⽤了 Overlap-tile
insiston最开始接触 U-Net
不适合对原图进⾏缩
数据量较少 或者 不适合对原图进⾏缩
的特征图尺⼨与对应层在下采样时的尺⼨不⼀致。
的特征图尺⼨与对应层在下采样时的尺⼨不⼀致。另外发现,这种策略可⽤于许多场景,特别是当 数据量较少
放(缩放通常使⽤插值算法,主流的插值算法如双线性插值具有低通滤波的性质,会使得图像的⾼频分量受损,从⽽造成图像轮廓和边缘等细节
损失,可能对模型学习有⼀定影响)时尤其适⽤,同时它还能起到为⽬标区域提供上下⽂信息
为⽬标区域提供上下⽂信息的作⽤。
随机切⽚、镜像填充后按序切⽚
镜像填充后按序切⽚本⽂先对这种策略的原理以及在U-Net中的使⽤进⾏说明,然后结合源码对该策略的实现进⾏解析,内容包括 随机切⽚
将切⽚重构成图像。
以及 将切⽚重构成图像。
Overlap-tile在U-Net中的使⽤
先来对Overlap-tile策略的原理及其在U-Net中的使⽤做个介绍,让⼤家对其有个初步印象和基本理解。
某⼀层特征图下采样后再上采样回来到对应层时,其尺⼨熟悉U-Net结构的炼丹者们肯定清楚,它并不是⼀个完全对称的结构
并不是⼀个完全对称的结构。也就是说,某⼀层特征图下采样后再上采样回来到对应层时,其尺⼨
会发⽣变化,⽐原来的⼩,原因在于U-Net使⽤的是不带padding的3x3卷积(valid卷积),每次经过这样的⼀个卷积就会使得特征图尺⼨减⼩会发⽣变化,⽐原来的⼩
2x2。
U-Netsugar daddy
显然,如果直接输⼊原图,那么最后输出的尺⼨会⽐原图⼩。如果我们希望得到和输⼊⼀致的尺⼨,会怎么做?
最直接的是对输出结果再进⾏⼀次上采样,可以使⽤插值或者转置卷积的⽅法,若使⽤插值,由于其是不可学习的,会带来⼀定的误差;⽽使⽤转
置卷积的话,⼜会增加参数量,并且模型也不⼀定能学习得好。
另外⼀种⽅法就是将U-Net中的valid卷积改为same卷积,即使⽤padding,这样每次3x3卷积就不会改变特征图的尺⼨了,最终上采样回来的尺
⼨就能够和输⼊⼀致了。但是,padding是会引⼊误差的,⽽且模型越深层得到的feature map抽象程度越⾼,受到padding的影响会呈累积效杰森玛耶兹
应。
上述⽅法都体现出明显的不⾜之处,那么有没有更好的⽅法呢?我们来看看U-Net中的Overlap-tile是怎么做的。
jackfruit镜像padding,这样,做法其实很简单,就是在输⼊⽹络前对图像进⾏padding,使得最终的输出尺⼨与原图⼀致。特别的是,这个padding是镜像padding 预测边界区域的时候就提供了上下⽂信息。
在预测边界区域的时候就提供了上下⽂信息
Overlap-tile
上图左边是对原图进⾏镜像padding后的效果,黄框是原图的左上⾓部分,padding后其四周也获得了上下⽂信息,与图像内部的其它区域有类似效果。
Overlap-tile策略可搭配 patch(图像分块)
patch(图像分块)⼀起使⽤。当内存资源有限从⽽⽆法对整张⼤图进⾏预测时,可以对图像先进⾏镜像padding,然
能够实现对任意⼤的图像进⾏⽆缝分割,同时每个图像块也获得了相应的上下后按序将padding后的图像分割成固定⼤⼩的patch。这样,能够实现对任意⼤的图像进⾏⽆缝分割,同时每个图像块也获得了相应的上下
不需⽂信息。
在数据量较少的情况下,每张图像都被分割成多个patch,相当于起到了扩充数据量的作⽤。更重要的是,这种策略不需⽂信息。另外,在数据量较少的情况下,每张图像都被分割成多个patch,相当于起到了扩充数据量的作⽤。
要对原图进⾏缩放,每个位置的像素值与原图保持⼀致,不会因为缩放⽽带来误差。
随机切⽚
随机切⽚是在图像内部随机选取patch中⼼,然后将图像切成固定数量的patch。
以下⽰例是对单张图像及对应的掩膜(mask)做随机切⽚。block什么意思
随机切⽚(i)
patch中⼼位置根据其尺⼨在图像内部随机选取,确定中⼼位置后,再根据各边长就可以确定patch的左上和右下两个顶点坐标。
随机切⽚(ii)
最后从原图中取出对应位置的区域即可。
随机切⽚(iii)
crush on you随机切⽚效果(左:切⽚得到的图像块;右:原图对应区域)
镜像填充
对原图进⾏镜像填充,能够使模型对边界区域进⾏预测时获得上下⽂信息。下图蓝框部分是原图的左上⾓部分,镜像填充后,得到红框部分。
镜像填充效果
镜像填充后会进⾏按序切⽚,在切⽚时,各patch之间可以设定⼀个固定的间隔,这样能够避免过份重叠。⾄于各边需要填充多少长度,可以基于以下两种⽅式来决定:
i). 填充后,各边都能恰好切出整数个patch(最后不会剩余⼀点长度不⾜⼀个patch);
ii). 提前计算输⼊输出之间的尺⼨差,使得padding后输出与输⼊尺⼨保持⼀致。
下⾯就第i)种⽅式进⾏源码解析。若有多张不同尺⼨的图⽚,那么就⼀张张独⽴处理;否则,可以组成⼀个批次进⾏处理。
镜像填充(i)
先在竖直⽅向上进⾏填充,填充后,将原图置于中间,顶部和底部使⽤原图的镜像进⾏填充。
小学英语口语练习
镜像填充(ii)
然后在⽔平⽅向上进⾏填充,同样地,将填充前的图像置于中间,左右两边剩余部分使⽤填充前图像的镜像进⾏填充。
镜像填充(iii)
按序切⽚
按序切⽚就是从图像的左上⽅开始,按照⼀定间隔依次将图像切成⼀个个⼩的图像块,直⾄图像的右下⽅。
按序切⽚(i)鄙视你的英文
各切⽚可能存在重叠部分。
注意,各切⽚之间的间隔是可以⼩于切⽚边长的,这就代表各切⽚可能存在重叠部分

本文发布于:2023-07-15 00:10:29,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/177645.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   填充   原图
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图