day-17 L1和L2正则化的tensorflow示例

2023年4月8日下午12:17 • tensorflow

机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两种，一般英文称作ℓ2-norm，中文称作L1正则化和L2正则化，或者L1范数和L2范数。L2范数也被称为权重衰减（weight decay）。

一般回归分析中回归w表示特征的系数，从上式可以看到正则化项是对系数做了处理（限制）。L1正则化和L2正则化的说明如下：

L1正则化是指权值向量||w||1
L2正则化是指权值向量2

关于二者如何解决机器学习中过拟合问题，可以参考如下链接：

https://blog.csdn.net/weiyongle1996/article/details/78161512

https://blog.csdn.net/jinping_shi/article/details/52433975

tensorflow中提供了两个函数，用于求某个权重w矩阵的L1和L2正则化，下面是代码示例：

'''
输入：
x = [[1.0,2.0]]
w = [[1.0,2.0],[3,0,4.0]]

输出：
y = x*w = [[7.0,10.0]]
l1 = (1.0+2.0+3.0+4.0)*0.5 = 5.0
l2 = (1.0**2 + 2.0**2 + 3.0**2 + 4.0**2) / 2)*0.5 = 7.5
'''

import tensorflow as tf
from tensorflow.contrib.layers import *

w = tf.constant([[1.0,2.0],[3.0,4.0]])
x = tf.placeholder(dtype=tf.float32,shape=[None,2])
y = tf.matmul(x,w)

with tf.Session()  as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    print(sess.run(y,feed_dict={x:[[1.0,2.0]]}))
    print("=========================")
    print(sess.run(l1_regularizer(scale=0.5)(w)))
    #(1.0+2.0+3.0+4.0)*0.5 = 5.0
    print("=========================")
    print(sess.run(l2_regularizer(scale=0.5)(w)))
    #(1.0**2 + 2.0**2 + 3.0**2 + 4.0**2) / 2)*0.5 = 7.5

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：day-17 L1和L2正则化的tensorflow示例 - Python技术站

tensorflow 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

使用清华开源镜像安装tensorflow

上一篇 2023年4月8日

TensorFlow 在android上的Demo（1）

下一篇 2023年4月8日

[机器学习(周志华)] 第一章习题1.2 参考答案

整理摘自 https://blog.csdn.net/icefire_tyh/article/details/52065626 若不考虑冗余：属性1 属性2 属性3 2 3 3 假设空间中有 3 * 4 * 4 + 1 = 49种假设。在不考虑沉余的情况下，最多包含k个合取式来表达假设空间，显然…

机器学习 2023年4月10日
000
成本卷积报错：CSTPSCEX.explode_sc_cost_flags():40:ORA-01476: 除数为 0

成本卷积请求：供应链成本累计 – 打印报表运行后报一下错误： MSG-00000: Rollup ID = 236403MSG-00000: Before CSTPSCEX.supply_chain_rollup 2014/10/23 10:35:53MSG-00000: After CSTPSCEX.supply_chain_rollup 2014/10…

卷积神经网络 2023年4月8日
000
机器学习-各距离定义

机器学习-各类距离的定义两个向量之间的距离（此时向量作为n维坐标系中的点）计算，在数学上称为向量的距离（distance），也称为样本之间的相似性度量（Similarity Measurement）它反映为某类事物在距离上接近或远离的程度。直觉上，距离越近的就越相似，越容易归为一类；距离越远就越不同。范数向量的范数可以简单、形象地理解为向量的长度，…

机器学习 2023年4月13日
000
机器学习笔记—–决策树算法1

引言：今天来和大家谈谈决策树算法。决策的重要性，我想就不必我多言了吧。但是还是先请大家看一下知乎的这个问题，普通人如何通过训练提高决策能力，http://www.zhihu.com/question/49602855?location=35 ，然后我们在来聊一聊，计算机如何快速提高决策能力。我想以自己为主，计算机为辅的决策将会给我们的生活带来质的飞跃。比如我…

机器学习 2023年4月12日
000
Caffe

caffe的损失函数

损失函数，一般由两项组成，一项是loss term,另外一项是regularization term。 J=L+R 先说损失项loss，再说regularization项。 1. 分对得分1，分错得分0.gold standard 2. hinge loss(for softmargin svm),J=1/2||w||^2 + sum(max(0,1-yf(…

2023年4月6日
000
tensorflow

TensorFlow？PyTorch？Paddle？AI工具库生态之争：ONNX将一统天下

AI诸多工具库工具库之间的切换，是一件耗时耗力的麻烦事。ONNX 即应运而生，使不同人工智能框架（如PyTorch、TensorRT、MXNet）可以采用相同格式存储模型数据并交互，极大方便了算法及模型在不同的框架之间的迁移，带来了AI生态的自由流通。… ? 作者：韩信子@ShowMeAI? 深度学习实战系列：https://www.showmeai.t…

2023年4月8日
000
循环神经网络

关于CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)

转自https://blog.csdn.net/qq_39521554/article/details/79337929 神经网络技术起源于上世纪五、六十年代，当时叫感知机（perceptron），拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层，在输出层得到分类结果。早期感知机的推动者是Rosenblatt。（扯一个不相关的：由于计算…

2023年4月8日
000
GAN生成对抗网络

[深度学习-原理]GAN(生成对抗网络)的简单介绍

系列文章目录深度学习GAN（一）之简单介绍深度学习GAN（二）之基于CIFAR10数据集的例子深度学习GAN（三）之基于手写体Mnist数据集的例子深度学习GAN（四）之PIX2PIX GAN的例子 GAN的简单介绍系列文章目录 1. 什么是GAN 2. GAN的原理 3. GAN的分类 3.1. 原始的GAN 3.2. 深度卷积GAN（Deep Co…

2023年4月5日
000

合作推广

合作推广

返回顶部