《机器学习基石》—正则化

2023年4月12日下午11:01 • 机器学习

yizhihongxing

本节涉及的知识点包括：

（1）所谓正则化，就是在原来的假设空间上加上一定限制条件；

（2）推导线性回归中引入L2正则；

（3）带正则化约束条件的问题等价于无约束的加正则项的augmented error；

（4）VC维解释正则的好处；

（5）选择一般正则项的三个原则；

（6）L1正则和L2正则的对比；

1 正则化的概念

所谓正则化假设空间，就是带有限制条件的假设空间。

2 线性回归引入正则化（岭回归）

引入正则化，就是对假设空间做一定的限制，也就是在原来的线性回归基础上加了约束条件：

《机器学习基石》---正则化

这个问题是一个约束优化问题，可以根据KKT条件求解。这里我们从几何的角度来推导：

《机器学习基石》---正则化

这里的红色圆圈，圆心表示原点，半径为C，显然w被约束在该圆形区域内。蓝色箭头是当前的负梯度方向，由于约束限制，w只能往梯度在圆形的切线方向上的分量进行更新。当w的方向与负梯度方向相同时，切线分量为0，就达到了在约束条件下的最优解。

即，最优的时候，w与负梯度成比例：

《机器学习基石》---正则化

即：

《机器学习基石》---正则化

其中λ大于0。这个式子也可以由KKT条件推出。

上式中代入线性回归的梯度形式，可以求得最优解（其中λ是与C有关的量）：

《机器学习基石》---正则化

这个形式被称为岭回归。

3 正则项

从另一个角度看，上面的问题等价于直接在原来的损失函数中引入正则项，这样的损失函数称为augmented error：

《机器学习基石》---正则化

由于λ是与C有关的量，那么我们不妨把λ当作参数。这样就用求解带正则项的augmented error代替了原来约束问题：

《机器学习基石》---正则化

下面是不同的λ带来的正则化的效果：

《机器学习基石》---正则化

在进行多项式转换时，使用legendre多项式可以构造一堆两两正交的基底，使得每个项对应的权重影响力是一样的：

《机器学习基石》---正则化

4 VC维的解释

加入正则项，等效于带约束的Ein。也就是有效的假设空间比不加正则项的假设空间更小了，VC维更低，因此泛化能力更好。

5 一般正则化项

前面讲的正则项只是很多正则项的一种，称为L2正则项。事实上，我们还可以选择其它的形式作为正则项。选择正则项的时候，可以考虑以下三个方向：

（1）target-dependent ：如果知道目标函数的信息，就可以选择与它方向一致的正则项。例如已知目标函数是偶函数，就可以只对奇次方的权重做限制。

（2）可行性：正则项可以让我们选出一个平滑和简单的假设函数。

（3）易优化的：加上正则项之后，应该是一个容易求解的优化问题。

《机器学习基石》---正则化

6 L1和L2正则对比

L1最后最优解一般会落在棱形的顶点上，因此通常是稀疏解。

《机器学习基石》---正则化

此外，参数λ的选择是很重要的。下图给出了在不同的随机噪声和确定性噪声下的不同的λ带来的效果：

《机器学习基石》---正则化

但是，噪声是不可知的，我们如何来选择合适的λ呢？这就是下一节 “验证”中要讲的了。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：《机器学习基石》—正则化 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

《机器学习基石》—验证

上一篇 2023年4月12日

《机器学习基石》—过拟合风险

下一篇 2023年4月12日

Keras（七）Keras.layers各种层介绍

原文链接：http://www.one2know.cn/keras8/ 一、网络层 keras的层主要包括：常用层（Core）、卷积层（Convolutional）、池化层（Pooling）、局部连接层、递归层（Recurrent）、嵌入层（ Embedding）、高级激活层、规范层、噪声层、包装层，当然也可以编写自己的层。对于层的操作 layer.ge…

Keras 2023年4月8日
000
TensorFlow函数：tf.random_shuffle

random_shuffle( value, seed=None, name=None ) 定义在：tensorflow/python/ops/random_ops.py. 请参阅指南：生成常量,序列和随机值>随机张量随机地将张量沿其第一维度打乱. 张量沿着维度0被重新打乱,使得每个 value[j] 被映射到唯一一个 output[i].例如,一个…

tensorflow 2023年4月6日
000
Caffe

windows下使用caffe测试mnist数据集

在win10机子上装了caffe，感谢大神们的帖子，要入坑caffe-windows的朋友们看这里，还有这里，安装下来基本没什么问题。好了，本博文写一下使用caffe测试mnist数据集的步骤。 1. 下载mnist数据集。不太看得懂get_mnist.ps1文件，并且运行无效，所以选择直接从mnist官网下载数据集。下载后解压，从解压后的文件夹提取出四…

2023年4月8日
000
图像处理

关于Stable Diffusion模型你应该知道的所有知识！

Stable Diffusion 模型主要有以下几种，每种模型都具有不同的特色和应用场景： 1.DeepStableDiffusion DeepStableDiffusion 是一种基于 Stable Diffusion 的深度学习模型，它可以根据输入的图像生成出高质量的绘画作品。该模型利用了深度卷积神经网络和扩散运算的结合，实现了更加精确的绘画效果。其特色…

2023年11月2日
001
PyTorch

windows下配置pytorch环境

借鉴了B站大佬的视频，自己总结安装如下。首先安装anaconda 按照操作顺序，依次安装，按照我个人习惯，不喜欢讲文件安装在C盘，你们自己决定。安装完毕之后。之后打开Anaconda Prompt，如下图：换源：输入红线命令到Anaconda Prompt中，不过我建议换清华源，因为用conda安装软件时，比如安装pytroch就会很容易中断，因为…

2023年4月8日
000
Keras

7.keras-模型保存和载入

keras-模型保存和载入 1.数据的载入与预处理 import numpy as np from keras.datasets import mnist from keras.utils import np_utils from keras.models import Sequential,load_model from keras.layers impo…

2023年4月5日
000
机器学习

【机器学习与R语言】6-线性回归

目录 1.理解回归 1）简单线性回归 2）普通最小二乘估计 3）相关系数 4）多元线性回归 2.线性回归应用示例 1）收集数据 2）探索和准备数据 3）训练数据 4）评估模型 5）提高模型性能确定一个唯一的因变量（需预测的值）和一个或多个数值型的自变量（预测变量）之间的关系。回归分析对数据间复杂关系建立模型，用来估计一种处理方法对结果影响和推断未来。也可…

2023年4月9日
000
卷积神经网络

转载：cnn学习之卷积或者池化后输出的map的size计算

相信各位在学习cnn的时候，常常对于卷积或者池化后所得map的的大小具体是多少，不知道怎么算。尤其涉及到边界的时候。首先需要了解对于一个输入的input_height*input_widtht的图像，在卷积或者池化的时候，经常需要加padding，这是为了处理边界问题时而采用的一种方式，于是原输入就变成了下图所示：对于输出的size计算如下图：…

2023年4月8日
000

合作推广

合作推广

返回顶部