可以先拿两个样本训练一下新模型, 原理可能是使model的weights变成非空, 具体后面补充总结. 转载于:https://www.cnblogs.com/zhangziyan/p/10842461.html