【CNN】理解卷积神经⽹络中的通道channel
豆沙面包卷
在深度学习的算法学习中,都会提到 channels 这个概念。在⼀般的深度学习框架的 conv2d 中,如 、,channels 都是必填的⼀个参数。channels 该如何理解?先看⼀看不同框架中的解释⽂档。
⾸先,是 中给出的,对于输⼊样本中 channels 的含义。⼀般的RGB图⽚,channels 数量是 3 (红、绿、蓝);⽽monochrome图⽚,channels 数量是 1 。
channels : Number of color channels in the example images. For color images, the number of channels is 3 (red, green, blue). For monochrome images, there is just 1 channel (black). ——
其次, 中提到的,⼀般 channels 的含义是,每个卷积层中卷积核的数量。
channels (int) : The dimensionality of the output space, i.e. the number of output channels (filters) in the convolution.
——
为了更直观的理解,下⾯举个例⼦,图⽚使⽤⾃ 。
简笔画嫦娥
知子莫若父如下图,假设现有⼀个为 6×6×36×6×3 的图⽚样本,使⽤ 3×3×33×3×3 的卷积核(filter)进⾏卷积操作。此时输⼊图⽚
的 channels 为 33 ,⽽卷积核中的 in_channels 与 需要进⾏卷积操作的数据的 channels ⼀致(这⾥就是图⽚样本,为3)。
接下来,进⾏卷积操作,卷积核中的27个数字与分别与样本对应相乘后,再进⾏求和,得到第⼀个结果。依次进⾏,最终得
到 4×44×4 的结果。
上⾯步骤完成后,由于只有⼀个卷积核,所以最终得到的结果为 4×4×14×4×1 , out_channels 为 11 。
白甲症在实际应⽤中,都会使⽤多个卷积核。这⾥如果再加⼀个卷积核,就会得到 4×4×24×4×2 的结果。
零碎总结⼀下,我偏好把上⾯提到的 channels 分为三种:
1. 最初输⼊的图⽚样本的 channels ,取决于图⽚类型,⽐如RGB;
2. 卷积操作完成后输出的 out_channels ,取决于卷积核的数量。此时的 out_channels 也会作为下⼀次卷积时的卷积核
鲶鱼汤
的 in_channels;
3. 卷积核中的 in_channels ,刚刚2中已经说了,就是上⼀次卷积的 out_channels ,如果是第⼀次做卷积,就是1中样本图⽚
的 channels 。
说到这⾥,相信已经把 channels 讲的很清楚了。在CNN中,想搞清楚每⼀层的传递关系,主要就是 height,width 的变化情况,和 channels 的变化情况。
最后再看看 中 v2d 的 input 和 filter 这两个参数。
input : [batch, in_height, in_width, in_channels] ,
胶原蛋白有哪些
filter : [filter_height, filter_width, in_channels, out_channels] 。
⾥⾯的含义是不是很清楚了?留学生免税车政策