机器学习tips

2023年4月12日下午10:23 • 机器学习

1 为什么随机梯度下降法能work？

https://www.zhihu.com/question/27012077中回答者李文哲的解释

2 随机梯度下降法的好处？

（1）加快训练速度（2）噪音可以使得跳出局部最优

3 权衡方差和偏差：

机器学习tips

偏差反映的是模型的准确度（对训练数据的吻合程度），方差则反映模型的稳定性（对测试数据的泛化能力）。模型越复杂，偏差越小，方差越大。

4 减少过拟合的方法：

（1）减少特征个数

（2）增大数据量

（3）引入正则项

5 L1和L2正则

（1）

L0范数：||x||0为x向量各个非零元素的个数

L1范数: ||x||1 为x向量各个元素绝对值之和。
L2范数: ||x||2为x向量各个元素平方和的1/2次方，L2范数又称Euclidean范数或者Frobenius范数

（2）

L0正则的特点是：防止过拟合，并给出稀疏结果用于特征选择，但由于加L0后问题很难求解，所以一般用L1来做稀疏。

L1正则的特点是：防止过拟合，给出稀疏结果，常用于特征选择。

L2正则的特点是防止过拟合。

（3）

L0能得到稀释结果比较好理解，那么为什么L1也能得到稀疏结果呢？

首先，加了正则之后的优化问题可以如下等价：

机器学习tips

然后来看看W是二维的情况下：

机器学习tips

可以发现，L2所规定的约束范围与等高线的交点通常不在坐标轴上，而L1由于范围是一个棱形，等高线与其交点刚好落在坐标轴上，对应于w1为0。当W是一个更高维的情况也是类似，这就解释了为什么L1能给出一个稀疏的结果，而L2不能。

*（4）L2正则的梯度很好求解，但是L1则不能简单求导解决，往往是用下面三种方法来解决：

机器学习tips

（5）L1正则有什么问题？

如果有几个变量相关性比较大，它会随机选出其中之一, 而不考虑其他的变量。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习tips - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

《机器学习基石》—理解机器为什么能学习（二）

上一篇 2023年4月12日

《机器学习基石》—感知机算法

下一篇 2023年4月12日

循环神经网络

循环神经网络经典模型

详细地介绍了经典的RNN、RNN几个重要变体，以及Seq2Seq模型、Attention机制。#一、从单层网络谈起在学习RNN之前，首先要了解一下最基本的单层网络，它的结构如图：#二、经典的RNN结构（N vs N）如：自然语言处理问题。x1可以看做是第一个单词，x2可以看做是第二个单词，依次类推。语音处理。此时，x1、x2、x3……是每帧的声音信号。时间…

2023年4月8日
000
卷积神经网络

卷积神经网络通俗解读

转载自：https://blog.csdn.net/dong_lxkm/article/details/80575207 一、前言最近一直在研究深度学习，联想起之前所学，感叹数学是一门朴素而神奇的科学。F＝G*m1*m2/r²万有引力描述了宇宙星河运转的规律，E=mc²描述了恒星发光的奥秘，V=H*d哈勃定律描述了宇宙膨胀的奥秘，自然界的大部分现象…

2023年4月8日
000
pytorch下的lib库源码阅读笔记（1）

置顶：将pytorch clone到本地，查看initial commit，已经是麻雀虽小五脏俱全了，非常适合作为学习模板。 2017年12月7日01:24:15 2017-10-25 17:51 参考了知乎问题如何有效地阅读PyTorch的源代码？相关回答按照构建顺序来阅读代码是很聪明的方法。 1，TH中最核心的是THStorage、THTen…

PyTorch 2023年4月8日
000
在 TensorFlow 中实现文本分类的卷积神经网络

在TensorFlow中实现文本分类的卷积神经网络Github提供了完整的代码： https://github.com/dennybritz/cnn-text-classification-tf 在这篇文章中，我们将实现一个类似于Kim Yoon的卷积神经网络语句分类的模型。本文提出的模型在一系列文本分类任务（如情绪分析）中实现了良好的分类性能，并已成为新…

卷积神经网络 2023年4月8日
000
机器学习第三练：为慈善机构寻找捐助者

这个任务同样是在Jupyter Notebook中完成，项目目的是通过前面的所有特征列，当然去掉序号列，然后预测最后一列，收入’income’，究竟是大于50K，还是小于等于50K. 第一步，探索数据，像探索性统计里经常涉及到的频数，均值，众数或者众位数相关的计算，我们通过这些统计指标，使用python来看一下数据的大概情况这块主要还是涉及pan…

机器学习 2023年4月11日
000
tensorflow1.0 构建卷积神经网络

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data import os os.environ[“CUDA_DEVICE_ORDER”] = “0,1” mnist = input_data.read_data_sets(“MNIST_data”,…

卷积神经网络 2023年4月6日
000
循环神经网络

灰灰深入浅出讲解循环神经网络（RNN）

我来钱庙复知世依，似我心苦难归久，相须莱共游来愁报远。近王只内蓉者征衣同处，规廷去岂无知草木飘。你可能以为上面的诗句是某个大诗人所作，事实上上面所有的内容都是循环神经网络写的，是不是感觉很神奇呢？其实这里面的原理非常简单，只需要对循环神经网络有个清楚的理解，那么就能够实现上面的效果，在读完本篇文章之后，希望大家都能够学会如何使用循环神经网络来创作文本。本…

2023年4月6日
000
tensorflow利用预训练模型进行目标检测（二）：预训练模型的使用

官网链接：https://github.com/tensorflow/models/blob/master/research/object_detection/object_detection_tutorial.ipynb 但是一直有问题，没有运行起来，所以先使用一个别人写好的代码上一个在ubuntu下可用的代码链接：https://gitee.com/…

目标检测 2023年4月6日
000

合作推广

合作推广

返回顶部