resnet152

152是指152次卷积

其中block共有3+8+36+3 = 50个

每个block是由3层卷积构成的bottle_net block.共150个卷积

开头一个卷积将3通道的图片提取特征。

后面一个nn.AdaptiveAvgPool2d((1,1)), 就是自适应平均池化,输出维度为1.

因为本来上面的各层卷积后输出的还是一个二维矩阵。图中的64,128等都是通道数,也就是二维矩阵的个数。最后要通过自适应池化将卷积最后的矩阵转换称一个1维的数。

然后才能用线性层进行维度映射。进行分类。

 

resnet用于不同的任务中,前面的提取特征部分都是一样的,知识后面的池化+线性部分,也就是决策器,不同。

用于图像分类、识别、跟踪、分割