科技知识干货！卷积神经网络深度与其性能之间的关系

VGG探索了卷积神经网络的深度与其性能之间的关系，成功地构筑了16～19层深的卷积神经网络，并且证明了增加网络的深度能够在一定程度上影响网络最终的性能，使错误率大幅下降，同时拓展性又很强，迁移到其他图片数据上的泛化性也非常好。

到目前为止，VGG仍然被广泛用来提取图像特征。VGG可以看成加深版本的AlexNet，二者都由卷积层、全连接层两大部分构成。VGG有如下特点。

（1）结构简洁。VGG由5层卷积层、3层全连接层、softmax输出层构成，层与层之间使用最大化池分开，所有隐层的激活单元都采用ReLU函数。

（2）小卷积核和多卷积子层。VGG有一个重要的特点，即它具有小卷积核。VGG没有采用AlexNet中比较大的卷积核尺寸，而是降低卷积核的大小（3×3）来模仿AlexNet的网络结构，增加卷积子层数也能够达到相同的目的。这样的改进可以减少参数，并且通过增加非线性映射的次数，提高网络的拟合或表达能力。

（3）小池化核。相比AlexNet的3×3的池化核，VGG全部采用2×2的池化核。

（4）通道数多。VGG网络第一层的通道数为64，后面每层都进行了翻倍，最多512个通道。通道数的增加，使得更多的信息可以被提取出来。

（5）层数更深、特征图更宽。由于卷积核专注于扩大通道数，池化专注于缩小宽和高，使得模型架构在更深、更宽的同时，控制了计算量的增加规模。

（6）全连接转卷积。这也是VGG的一个特点。在网络测试阶段，将训练阶段的3个全连接替换为3个卷积，使测试得到的全卷积网络因为没有全连接的限制，可以接收任意宽或高的输入，这在测试阶段是非常重要的。

如图所示，输入图像是224×224×3像素点，如果后面3个层都是全连接，那么在测试阶段就只能将测试的图像全部都缩放大小到224×224×3像素点，才能符合后面全连接层的输入数量要求，这样就不便于测试工作的开展。而“全连接转卷积”可以参考图进行替换。

页面更新：2024-03-05

中芯国际：目前集成电路芯片制造供不应求