机器学习之拟合和过拟合问题

2023年4月16日下午8:14 • 机器学习

yizhihongxing

过拟合：当某个模型过度的学习训练数据中的细节和噪音，以至于模型在新的数据上表现很差，我们称过拟合发生了，通俗点就是：模型在训练集中测试的准确度远远高于在测试集中的准确度。

过拟合问题通常发生在变量特征过多的时候。这种情况下训练出的方程总是能很好的拟合训练数据，也就是说，我们的代价函数可能非常接近于0或者就为0，使其拟合只局限于训练样本中，无法很好预测其他新的样本。

欠拟合：在训练数据和未知数据上表现都很差

解决过拟合问题的方法主要有：

1. 减少特征数量，通过人工或者算法选择哪些特征有用保留，哪些特征没用删除，但会丢失信息。
2. 正则化，保留特征，但减少特征对应参数的大小，让每个特征都对预测产生一点影响。

解决欠拟合问题的方法主要有：

1.减少正则化：正则化可以避免过拟合的发生，因此在出现过拟合的情况时，可以通过减少正则化的损失函数来防止过拟合的发生。

2.添加数据量和特征维度：由于模型可用于学习的数据规模可能不足够大，导致模型训练的不够充分，模型复杂度不够。还有如果统计的数据信息中，各个维度数量收集的不够或者维度信息中大部分不具有区分样本的特质。面对这种问题主要方法是收集更多的特质维度，或者增加采样信息等方式来扩充数据。

3.增加算法模型的复杂度：例如很多训练样本不是线性可分的，如果单用线性方法来拟合可能无法达到一个理想的拟合方法，这时候引入非线性方法，如核函数等方法或者更复杂的深度学习等方法来增加模型的复杂度

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习之拟合和过拟合问题 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

用bayes公式进行机器学习的经典案例

上一篇 2023年4月16日

机器学习算法(KNN)

下一篇 2023年4月16日

对ONNX模型进行BN和卷积层的融合

对Resnet50.onnx模型进行BN和卷积层的融合一、准备工作安装ONNX You can then install ONNX from PyPi (Note: Set environment variable ONNX_ML=1 for onnx-ml): pip install onnx You can also build and inst…

卷积神经网络 2023年4月8日
000
目标检测

目标检测 object-detection

This is a list of awesome articles about object detection.from: 引自GitHubR-CNNFast R-CNNFaster R-CNNLight-Head R-CNNCascade R-CNNSPP-NetYOLOYOLOv2YOLOv3YOLTSSDDSSDFSSDESSDMDSSDPelee…

2023年4月8日
000
【机器学习】Octave 实现逻辑回归 Logistic Regression

34.62365962451697,78.0246928153624,0 30.28671076822607,43.89499752400101,0 35.84740876993872,72.90219802708364,0 60.18259938620976,86.30855209546826,1 79.0327360507101,75.344376436…

机器学习 2023年4月10日
000
卷积神经网络

卷积神经网络算法的一个实现

　　从理解卷积神经到实现它，前后花了一个月时间，现在也还有一些地方没有理解透彻，CNN还是有一定难度的，不是看哪个的博客和一两篇论文就明白了，主要还是靠自己去专研，阅读推荐列表在末尾的参考文献。目前实现的CNN在MINIT数据集上效果还不错，但是还有一些bug，因为最近比较忙，先把之前做的总结一下，以后再继续优化。　　卷积神经网络CNN是Deep Lear…

2023年4月8日
000
Keras

解决AttributeError: module ‘keras.backend’ has no attribute ‘image_dim_ordering’:错误的问题

错误示例：这个问题是由于Keras的版本不同造成的，代码if K.image_dim_ordering() == “th”: 是Keras旧版本使用的代码，如果你使用的是新版本，那么将 K.image_dim_ordering() == “th” 代码改为 K.image_data_format() == “channels_first” 即可。改正…

2023年4月8日
000
keras调用预训练模型分类

在网上看到一篇博客，地址https://www.pyimagesearch.com/2017/03/20/imagenet-vggnet-resnet-inception-xception-keras/，是关于利用keras上预训练的模型进行图像分类的示例，于是我也自己动手运行了一下，效果，一般。上代码 from keras.applications im…

Keras 2023年4月8日
000
tensorflow

tensorFlow-深度学习训练并行模式

1.简介 TensorFlow可以很容易地利用单个GPU加速深度学习模型的训练过程，但要利用更多的GPU或者机器，需要了解如何并行化训练深度学习模型。常用的并行化深度学习模型训练方式有两种，同步模式和异步模式。 2.两种模式的区别为帮助读者理解这两种训练模式，首先简单回顾一下如何训练深度学习模型。下图展示了深度学习模型的训练流程图。深度学习模型的训练是一个…

2023年4月8日
000
pytorch与torchvision版本、tensorflow与keras版本

pytorch==1.1.0 torchvision==0.3.0 pytorch==1.0.0 torchvision==0.2.1来源：https://pytorch.org/get-started/previous-versions/tensorflow2.1 keras2.3.1 python3.6来源：https://docs.floydhub.c…

Keras 2023年4月6日
000

合作推广

合作推广

返回顶部