案例分析

加载数据部分同上一个案例,只需把数据输入到预训练的VGG-16或者ResNet50中。VGG-16的网络结构为右侧图绿色栏所示其中block1中有2个包含64个卷积核的卷积层,block2包含2128个卷积核的卷积层,block33个包含256个卷积核的卷积层,block43个包含512个卷积核的卷积层,block53个包含512个卷积核的卷积层,加上2个包含4096个神经元的全连接层和1个包含1000个神经元的全连接层。

基于图像识别的迁移学习之一-LMLPHP

ResNet2个基本的block,一个是identity block,输入和输出的维度是一样的,所以可以串联多个;另外一个基本blockconv block,输入和输出的维度是不一样的,所以不能连续串联,它的作用本来就是为了改变特征向量的维度。

基于图像识别的迁移学习之一-LMLPHP

ResNet50网络结构中block_sizes=[3, 4, 6, 3]指的是stage1(first pool)之后的4layerblock数,分别对应res2res3res4res5,每一个layer的第一个blockshortcut上做conv+BN,即conv block

基于图像识别的迁移学习之一-LMLPHP 

10-12 13:11