四世同堂英语
yes i am论⽂解读之FeaturePyramidNetworksforObjectDetection
论⽂名称:Feature Pyramid Networks for Object Detection
gre报名费
这是⼀篇CVPR2017的⽂章,提出⼀种新型的特征⾦字塔⽹络,作者是何开明等⼈
⾸先,⽂章介绍了特征⾦字塔,特征⾦字塔是图像识别领域的⼀个基础元素,何为特征⾦字塔?如下图所⽰:聚餐英文
guest是什么意思上图就是⼀个传统的图像⾦字塔,针对⼀个输⼊图像,resize成多个scale,针对每个scale,都输⼊⽹络训练,预测,这样,⽹络能够针对不同的scale的图像进⾏预测,但是问题很明显,也很严重,就是计算开销太⼤
于是,作者要探索⼀种新型的特征⾦字塔来解决这个问题
关于特征⾦字塔,作者举例了传统的3类和⾃⼰提出的⾦字塔,如下图所⽰
其中,图a已经在上⾯介绍,图b就是只⽤⼀个单⼀scale的图像进⾏训练,预测,抛弃了multi-scale特征,对于图c⽽⾔,与图b类似,但是在⽹络进⾏卷积过程中,图像的size在不断变⼩,在特定阶段进⾏预测。图d就是作者提出的模型,
英文表白句子
虽然图c中的模型可以解决相关的问题,但是抛弃了⾼纬度的特征,例如,在图像的细节预测上,⼀些微⼩的物体只有在⾼层次的卷积层才可以识别,在低维的卷积层是⽆法识别的,那么对图c的模型⽽⾔,很显然,在低层次的预测结果是很差的,因为此时没有考虑⾼维的图像特征,但是图d的模型解决了这个问题,将⾼维特征进⾏逐步下采样,与相应卷积层的特征图相加即可。既能结合⾼维的特征,⼜能在较⼩的计算开销下产⽣multi-scale的输出。
有些模型与作者提出的模型类似,如下图所⽰
上图中有两个模型,分别称为top和bottom,其中,bottom是作者提出的模型,相对于作者提出的模型⽽⾔,top模型只在最后进⾏预测,但是bottom模型能够产⽣所有level的输出。
那么具体要怎么做呢?如下图所⽰
怎样快速学英语如上图所⽰,训练分两个过程,左边是bottom-to-up,右边是up-to-bottom
⾸先是bottom-to-up,逐步卷积,完成卷积后,就是up-to-bottom
efg
具体的操作,我做了⼀个图,如下图所⽰
⾸先,输⼊经过layer1,layer2,layer3的3个卷积层,随后,开始预测输出
layer3的输出⽤1X1的卷积核反卷积,即为top-layer1的输出;
top-layer1的输出⽤3X3的卷积核反卷积,实现2X上采样,同时layer2的输出进⾏通道压缩,⽤1X1的卷积核压缩为1通道后反卷积(此时的反卷积不需要上采样),将layer2操作的结果与top-layer1操作的结果相加,即为top-layer2的输出;
同理,top-layer2的输出进⾏2X上采样,将layer1的输出通道合并,反卷积,与之相加,即为top-layer3的输出
⾄此,该篇论⽂结束
其实,此类型的⾦字塔在其他⽂章中已经存在,
爱慕者举个例⼦,CVPR2017中,有⼀篇名为SRN: Side-output Residual Network for Object Symmetry Detection in the Wild ----CVPR 2017的论⽂,其中就是逐步下采样。
考研政治真题答案可以看下SRN论⽂中的⼀张图,
这个deep-to-shallow与shallow-to-deep就类似于该篇论⽂中的bottom-to-up与up-tp-bottom
本⼈有⼀篇关于SRN的解读博客,