本文主要是博主学习gluon时候的一些总结,共勉,如有错误,欢迎指正
gluon主要有3个方法得到预训练模型:
- gluon自身的model_zoo
- gluoncv提供的model_zoo
- mxnet提供的预训练模型(.params ,.json)
下面分别就这三个方面进行介绍
一:读取gluon model_zoo提供的模型,并进行finetune
gluon提供的model主要在gluon.model_zoo.vision下,模型地址:https://mxnet.incubator.apache.org/api/python/gluon/model_zoo.html,你可以根据自己的情况查找对应的模型进行使用。model_zoo提供的模型均为features+output结构
调用方法如下:
一:只修改最终的fc层,进行finetune:
from mxnet import gluon
class_num = 3
ctx = [mx.gpu(0),mx.gpu(1)]
finetune_net = gluon.model_zoo.vision.resnet50_v2(pretrained=True)
with finetune_net.name_scope():
finetune_net.output = nn.Dense(class_num)
finetune_net.output.initialize(init=mx.init.Xavier(),ctx=ctx)
finetune_net.hybridize()
二:不仅仅修改最终的fc层,还可以增加几层
下面的方法,首先提取出features,然后构建增加的sequential,最后将两部分通过sequential合并在一起。
from mxnet import gluon
pretrained_net = gluon.model_zoo.vision.resnet50_v2(pretrained=True)
pretrained_net_features = pretrained_net.features
class_num = 3
ctx = [mx.gpu(0),mx.gpu(1