可以先拿两个样本训练一下新模型, 原理可能是使model的weights变成非空, 具体后面补充总结.