caffe fine tune 复制预训练model的参数和freeze指定层参数

2023年4月7日下午10:05 • Caffe

复制预训练model的参数，只需要重新copy一个train_val.prototxt。然后把不需要复制的层的名字改一下，如（fc7 -> fc7_new），然后fine tune即可。

freeze指定层参数，只需要把对应层的学习率lr_mult 设置为0即可，如：

在layer里面加上param { lr_mult: 0 }就可以了，比如全连接层里面：
layer {
type: "InnerProduct"
param { # 对应第1个参数blob的配置，也就是全连接层的参数矩阵的配置
lr_mult: 0 # 学习率为0，其他参数可以看caffe.proto里面的ParamSpec这个类型
}
param { # 对应第2个参数blob的配置，也就是全连接层的偏置项的配置
lr_mult: 0 # 学习率为0
}
}

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：caffe fine tune 复制预训练model的参数和freeze指定层参数 - Python技术站

Caffe 人工智能

0 0 打赏

微信扫一扫

支付宝扫一扫

编译caffe-gpu-cuda及cudnn-tar 下载地址

上一篇 2023年4月7日

caffe make 编译

下一篇 2023年4月7日

Keras

使用 Keras + CNN 识别 CIFAR-10 照片图像

import tensorflow as tf import numpy as np import math import timeit import matplotlib.pyplot as plt import matplotlib import os from keras.utils import np_utils from keras.models …

2023年4月6日
000
目标检测

[AI开发]目标检测之素材标注

算力和数据是影响深度学习应用效果的两个关键因素，在算力满足条件的情况下，为了到达更好的效果，我们需要将海量、高质量的素材数据喂给神经网络，训练出高精度的网络模型。吴恩达在深度学习公开课中提到，在算力满足要求的前提下，模型效果会随着素材数量的增多而变好，理论上没有上限。实践证明，在普通基于深度学习的应用开发过程中，素材的数量和质量对最终模型效果的影响出乎意料的…

2023年4月8日
000
目标检测

从目标检测到图像分割简要发展史

http://www.tensorflownews.com/，学习更多的机器学习、深度学习的知识！ by 小韩（来源： https://blog.athelas.com/a-brief-history-of-cnns-in-image-segmentation-from-r-cnn-to-mask-r-cnn-34ea83205de4 ）本文目标 201…

2023年4月8日
000
循环神经网络

吴恩达老师深度学习视频课笔记：循环神经网络

Why sequence models?：序列数据例子，如下图：(1).语音识别(speech recognition)：给定一个输入音频片段X，并要求输出片段对应的文字记录Y，这里输入和输出都是序列数据(sequence data)。因为X是按时序播放的音频片段，输出Y是一系列单词。(2). 音乐生成(music generation)：只有输出数据Y是序…

2023年4月8日
000
tensorflow1.0 模型的保存与加载

import tensorflow as tf import numpy as np # ##Save to file # W = tf.Variable([[4,5,6],[7,8,9]],dtype=tf.float32,name=”weight”) # b = tf.Variable([[2,5,8]],dtype=tf.float32,name=”b…

tensorflow 2023年4月8日
000
Kaggle图像分割比赛：keras平台训练unet++模型识别盐沉积区（一）

Kaggle机器学习竞赛是全球最著名的人工智能比赛，每个竞赛项目都吸引了大量AI爱好者参与。这里选择2018年底进行的盐沉积区识别竞赛作为例子：https://www.kaggle.com/c/tgs-salt-identification-challenge 一、数据可以从Kaggle网站下载，但需先注册，下载速度可能也必将慢。可以直接从我的百度网盘下…

Keras 2023年4月7日
000
在浏览器中运行Keras模型，并支持GPU

Keras.js 推荐一下网页上的 demohttps://transcranial.github.io/keras-js/#/ 加载的比较慢，但是识别的非常快。 Run Keras models (trained using Tensorflow backend) in your browser, with GPU support. Models are …

Keras 2023年4月7日
000
Keras

Keras高层API之Metrics

在tf.keras中，metrics其实就是起到了一个测量表的作用，即测量损失或者模型精度的变化。metrics的使用分为以下四步： step1:Build a meter acc_meter = metrics.Accuracy() loss_meter = metrics.Mean() step2:Update data loss_meter.updat…

2023年4月8日
000

合作推广

返回顶部

caffe fine tune 复制预训练model的参数和freeze指定层参数

相关文章