吴恩达机器学习笔记20-正则化代价函数

2023年4月11日上午1:39 • 机器学习

yizhihongxing

上面的回归问题中如果我们的模型是：
吴恩达机器学习笔记20-正则化代价函数

　　我们可以从之前的事例中看出，正是那些高次项导致了过拟合的产生，所以如果我们能
让这些高次项的系数接近于0 的话，我们就能很好的拟合了。
　　所以我们要做的就是在一定程度上减小这些参数???? 的值，这就是正则化的基本方法。我
们决定要减少????3和????4的大小，我们要做的便是修改代价函数，在其中????3和????4 设置一点惩罚。
这样做的话，我们在尝试最小化代价时也需要将这个惩罚纳入考虑中，并最终导致选择较小
一些的????3和????4。
　　修改后的代价函数如下：

吴恩达机器学习笔记20-正则化代价函数

　　通过这样的代价函数选择出的????3和????4 对预测结果的影响就比之前要小许多。假如我们
有非常多的特征，我们并不知道其中哪些特征我们要惩罚，我们将对所有的特征进行惩罚，
并且让代价函数最优化的软件来选择这些惩罚的程度。这样的结果是得到了一个较为简单的
能防止过拟合问题的假设：

吴恩达机器学习笔记20-正则化代价函数

　　其中????又称为正则化参数（Regularization Parameter）。注：根据惯例，我们不对????0 进
行惩罚。经过正则化处理的模型与原模型的可能对比如下图所示：
吴恩达机器学习笔记20-正则化代价函数

　　如果选择的正则化参数λ 过大，则会把所有的参数都最小化了，导致模型变成 ℎ????(????) =

????0，也就是上图中红色直线所示的情况，造成欠拟合。
那为什么增加的一项

吴恩达机器学习笔记20-正则化代价函数

可以使????的值减小呢？
　　因为如果我们令 ???? 的值很大的话，为了使Cost Function 尽可能的小，所有的 ???? 的值
（不包括????0）都会在一定程度上减小。

　　但若λ 的值太大了，那么????（不包括????0）都会趋近于0，这样我们所得到的只能是一条

平行于????轴的直线。
　　所以对于正则化，我们要取一个合理的 ???? 的值，这样才能更好的应用正则化。
回顾一下代价函数，为了使用正则化，让我们把这些概念应用到到线性回归和逻辑回归
中去，那么我们就可以让他们避免过度拟合了。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：吴恩达机器学习笔记20-正则化代价函数 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

机器学习基石作业2

上一篇 2023年4月11日

拿到机器学习数据后，该如何对数据进行划分？

下一篇 2023年4月11日

机器学习笔记：Gradient Descent – 李小宝

机器学习笔记：Gradient Descent 　　最近掉进了Machine Learning的坑里，暑期听完了龙星计划的机器学习课程，走马观花看了一些书。最近找了Stanford的Machine Learning的公开课（http://v.163.com/special/opencourse/machinelearning.html），想系统地学习一遍，而…

机器学习 2023年4月12日
000
ubuntu166.04之Caffe安装

写在前面：之前一直在搞keras，最近由于某些需求，需要学习caffe，在此记录caffe的安装记录。默认已经安装了cuda 如果是从其他的深度学习平台迁移到Caffe，那么按照这个教程来就可以了。第一步：git clone https://github.com/BVLC/caffe.git，然后安装下面的一对依赖文件。 apt-get install l…

Caffe 2023年4月6日
000
卷积神经网络

深度学习原理与框架-卷积网络细节-迁移学习 1.冻结层数，只进行部分层的训练

迁移学习：主要有3类，第一类，使用别人训练好的权重参数，作为初始化权重参数，进行接下来的训练第二类：使用别人训练好的权重参数，冻结预测层之前的所有的权重参数，进行接下来的训练第三类：使用别人训练好的权重参数，即finetune，不冻结最后一个卷积层和全连接层，对这两个层进行参数的更新和训练代码：使用keras框架进行的参…

2023年4月8日
000
目标检测

Win10 + YOLOv3 环境配置，编译，实现目标检测—-How to compile YOLOv3 on Windows

其他比较好的参考链接：环境配置：环境配置的最终图片列表：https://blog.csdn.net/shanglianlm/article/details/80322718 视频讲解YOLOv1:https://www.bilibili.com/video/av23354360/?p=3 YOLOv3官网链接GitHub：https://github.c…

2023年4月6日
000
[深度学习] Pytorch（三）—— 多/单GPU、CPU，训练保存、加载模型参数问题

上一篇实践学习中，遇到了在多/单个GPU、GPU与CPU的不同环境下训练保存、加载使用使用模型的问题，如果保存、加载的上述三类环境不同，加载时会出错。就去研究了一下，做了实验，得出以下结论：多/单GPU训练保存模型参数、CPU加载使用模型 #保存 PATH = ‘cifar_net.pth’ torch.save(net.module.state_dict…

PyTorch 2023年4月8日
000
[深度学习]CNN–卷积神经网络中用1*1 卷积有什么作用

1*1卷积过滤器和正常的过滤器一样，唯一不同的是它的大小是1*1，没有考虑在前一层局部信息之间的关系。最早出现在 Network In Network的论文中，使用1*1卷积是想加深加宽网络结构，在Inception网络（ Going Deeper with Convolutions ）中用来降维. 由于3*3卷积或者5*5卷积在几百个filter的卷…

卷积神经网络 2023年4月8日
000
Keras

tf.keras自定义损失函数

自定义损失函数 In statistics, the Huber loss is a loss function used in robust regression, that is less sensitive to outliers in data than the squared error loss. A variant for classifica…

2023年4月8日
000
卷积神经网络

Resnest：注意力+分组卷积的融合

ResNeSt是亚马逊的李沐团队的paper，最近在各个任务上刷榜了，但却被ECCV2020 strong reject了，在知乎上也是引起了热议，据李沐说这个网络花了一百万刀！我看完以后感觉是ResNeXt + SKNet的组合，训练网络的很多tricks在工程上还是很有意义的。讨论：https://www.zhihu.com/question/3…

2023年4月7日
000

合作推广

合作推广

返回顶部