科技知识干货!卷积神经网络深度与其性能之间的关系

VGG探索了卷积神经网络的深度与其性能之间的关系,成功地构筑了16~19层深的卷积神经网络,并且证明了增加网络的深度能够在一定程度上影响网络最终的性能,使错误率大幅下降,同时拓展性又很强,迁移到其他图片数据上的泛化性也非常好。

到目前为止,VGG仍然被广泛用来提取图像特征。VGG可以看成加深版本的AlexNet,二者都由卷积层、全连接层两大部分构成。VGG有如下特点。

科技知识干货!卷积神经网络深度与其性能之间的关系

(1)结构简洁。VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用最大化池分开,所有隐层的激活单元都采用ReLU函数。

(2)小卷积核和多卷积子层。VGG有一个重要的特点,即它具有小卷积核。VGG没有采用AlexNet中比较大的卷积核尺寸,而是降低卷积核的大小(3×3)来模仿AlexNet的网络结构,增加卷积子层数也能够达到相同的目的。这样的改进可以减少参数,并且通过增加非线性映射的次数,提高网络的拟合或表达能力。

(3)小池化核。相比AlexNet的3×3的池化核,VGG全部采用2×2的池化核。

(4)通道数多。VGG网络第一层的通道数为64,后面每层都进行了翻倍,最多512个通道。通道数的增加,使得更多的信息可以被提取出来。

(5)层数更深、特征图更宽。由于卷积核专注于扩大通道数,池化专注于缩小宽和高,使得模型架构在更深、更宽的同时,控制了计算量的增加规模。

(6)全连接转卷积。这也是VGG的一个特点。在网络测试阶段,将训练阶段的3个全连接替换为3个卷积,使测试得到的全卷积网络因为没有全连接的限制,可以接收任意宽或高的输入,这在测试阶段是非常重要的。

如图所示,输入图像是224×224×3像素点,如果后面3个层都是全连接,那么在测试阶段就只能将测试的图像全部都缩放大小到224×224×3像素点,才能符合后面全连接层的输入数量要求,这样就不便于测试工作的开展。而“全连接转卷积”可以参考图进行替换。

展开阅读全文

页面更新:2024-03-05

标签:卷积   神经网络   小池   深度   错误率   性能   目的   干货   像素   图像   特征   通道   阶段   结构   关系   测试   知识   科技   网络

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top