【机器学习】Cross-Validation（交叉验证）详解

2023年4月10日下午10:02 • 机器学习

yizhihongxing

本文章部分内容基于之前的一篇专栏文章：统计学习引论

在机器学习里，通常来说我们不能将全部用于数据训练模型，否则我们将没有数据集对该模型进行验证，从而评估我们的模型的预测效果。为了解决这一问题，有如下常用的方法：

1.The Validation Set Approach

第一种是最简单的，也是很容易就想到的。我们可以把整个数据集分成两部分，一部分用于训练，一部分用于验证，这也就是我们经常提到的训练集（training set）和测试集（test set）。

例如，如上图所示，我们可以将蓝色部分的数据作为训练集（包含7、22、13等数据），将右侧的数据作为测试集（包含91等），这样通过在蓝色的训练集上训练模型，在测试集上观察不同模型不同参数对应的MSE的大小，就可以合适选择模型和参数了。

不过，这个简单的方法存在两个弊端。

1.最终模型与参数的选取将极大程度依赖于你对训练集和测试集的划分方法。什么意思呢？我们再看一张图：

右边是十种不同的训练集和测试集划分方法得到的test MSE，可以看到，在不同的划分方法下，test MSE的变动是很大的，而且对应的最优degree也不一样。所以如果我们的训练集和测试集的划分方法不够好，很有可能无法选择到最好的模型与参数。

2.该方法只用了部分数据进行模型的训练

我们都知道，当用于模型训练的数据量越大时，训练出来的模型通常效果会越好。所以训练集和测试集的划分意味着我们无法充分利用我们手头已有的数据，所以得到的模型效果也会受到一定的影响。

基于这样的背景，有人就提出了Cross-Validation方法，也就是交叉验证。

2.Cross-Validation

2.1 LOOCV

首先，我们先介绍LOOCV方法，即（Leave-one-out cross-validation）。像Test set approach一样，LOOCV方法也包含将数据集分为训练集和测试集这一步骤。但是不同的是，我们现在只用一个数据作为测试集，其他的数据都作为训练集，并将此步骤重复N次（N为数据集的数据数量）。

如上图所示，假设我们现在有n个数据组成的数据集，那么LOOCV的方法就是每次取出一个数据作为测试集的唯一元素，而其他n-1个数据都作为训练集用于训练模型和调参。结果就是我们最终训练了n个模型，每次都能得到一个MSE。而计算最终test MSE则就是将这n个MSE取平均。

比起test set approach，LOOCV有很多优点。首先它不受测试集合训练集划分方法的影响，因为每一个数据都单独的做过测试集。同时，其用了n-1个数据训练模型，也几乎用到了所有的数据，保证了模型的bias更小。不过LOOCV的缺点也很明显，那就是计算量过于大，是test set approach耗时的n-1倍。

为了解决计算成本太大的弊端，又有人提供了下面的式子，使得LOOCV计算成本和只训练一个模型一样快。

其中表示第i个拟合值，而则表示leverage。关于的计算方法详见线性回归的部分（以后会涉及）。

2.2 K-fold Cross Validation

另外一种折中的办法叫做K折交叉验证，和LOOCV的不同在于，我们每次的测试集将不再只包含一个数据，而是多个，具体数目将根据K的选取决定。比如，如果K=5，那么我们利用五折交叉验证的步骤就是：

1.将所有数据集分成5份

2.不重复地每次取其中一份做测试集，用其他四份做训练集训练模型，之后计算该模型在测试集上的【机器学习】Cross-Validation（交叉验证）详解

3.将5次的【机器学习】Cross-Validation（交叉验证）详解取平均得到最后的MSE

不难理解，其实LOOCV是一种特殊的K-fold Cross Validation（K=N）。再来看一组图：

每一幅图种蓝色表示的真实的test MSE，而黑色虚线和橙线则分贝表示的是LOOCV方法和10-fold CV方法得到的test MSE。我们可以看到事实上LOOCV和10-fold CV对test MSE的估计是很相似的，但是相比LOOCV，10-fold CV的计算成本却小了很多，耗时更少。

2.3 Bias-Variance Trade-Off for k-Fold Cross-Validation

最后，我们要说说K的选取。事实上，和开头给出的文章里的部分内容一样，K的选取是一个Bias和Variance的trade-off。

K越大，每次投入的训练集的数据越多，模型的Bias越小。但是K越大，又意味着每一次选取的训练集之前的相关性越大（考虑最极端的例子，当k=N，也就是在LOOCV里，每次都训练数据几乎是一样的）。而这种大相关性会导致最终的test error具有更大的Variance。

一般来说，根据经验我们一般选择k=5或10。

2.4 Cross-Validation on Classification Problems

上面我们讲的都是回归问题，所以用MSE来衡量test error。如果是分类问题，那么我们可以用以下式子来衡量Cross-Validation的test error：

其中Erri表示的是第i个模型在第i组测试集上的分类错误的个数。

图片来源：《An Introduction to Statistical Learning with Applications in R》

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：【机器学习】Cross-Validation（交叉验证）详解 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

机器学习-算法应用场景

上一篇 2023年4月10日

20171022机器学习之线性回归-求时间与功率的关系（解决单项式线性方程）

下一篇 2023年4月10日

Caffe 编译

Compilation Now that you have the prerequisites, edit your Makefile.config to change the paths for your setup The defaults should work, but uncomment the relevant lines if using An…

Caffe 2023年4月6日
000
【强化学习】使用off-policy算法机器人抓取任务基准；生成对抗网络 GAN 就是强化学习

本文转自雷克世界（ID：raicworld）编译 | 嗯~阿童木呀在本文中，我们探讨了用于基于视觉的机器人抓取操作的深度强化学习算法。无模型深度强化学习（RL）已经在一系列具有挑战性的环境中得到了成功应用，但算法的激增使得我们难以辨别出哪种特定的方法最适合于执行一个丰富的、多样化的任务，例如抓取。为了回答这一问题，我们提出了一个机器人抓取的模拟基准，强调…

GAN生成对抗网络 2023年4月6日
000
TensorFlow 算术运算符

TensorFlow 算术运算符 TensorFlow 提供了几种操作，您可以使用它们将基本算术运算符添加到图形中。 tf.add tf.subtract tf.multiply tf.scalar_mul tf.div tf.divide tf.truediv tf.floordiv tf.realdiv tf.truncatediv tf.floor_d…

tensorflow 2023年4月6日
000
目标检测

小白也能弄懂的目标检测之YOLO系列 – 第一期

大家好，上期分享了电脑端几个免费无广告且实用的录屏软件，这期想给大家来讲解YOLO这个算法，从零基础学起，并最终学会YOLOV3的Pytorch实现，并学会自己制作数据集进行模型训练，然后用自己训练好的模型进行预测。话不多说，先上我用VisDrone数据集进行训练的效果图：在正式制作数据集进行模型训练之前，还是向大家介绍一下YOLO的来源以及其作用效果，…

2023年4月8日
000
目标检测

Windows版YOLOv4目标检测实战：中国交通标志识别

课程目标：掌握Windows上使用YOLOv4进行TT100K数据集上的中国交通标志识别课程链接：https://edu.csdn.net/course/detail/29363 课程演示环境：Windows10需要学习Ubuntu系统YOLOv4的同学请前往《YOLOv4目标检测实战：中国交通标志识别》课程链接：https://edu.csdn.net…

2023年4月8日
000
Pytorch 中 tensor的维度拼接

torch.stack() 和 torch.cat() 都可以按照指定的维度进行拼接，但是两者也有区别，torch.satck() 是增加新的维度进行堆叠，即其维度拼接后会增加一个维度；而torch.cat() 是在原维度上进行堆叠，即其维度拼接后的维度个数和原来一致。具体说明如下： torch.stack(input,dim) input: 待拼接的张量序…

PyTorch 2023年4月8日
000
目标检测

目标检测标注工具labelImg源代码安装及使用技巧

一、labelImg安装（源代码安装，py2.7环境） 1、下载LabelImg 在ｈｏｍｅ目录下打开终端输入 $ git clone https://github.com/tzutalin/labelImg 2、安装 $ sudo apt-get install pyqt4-dev-tools # 安装PyQt4 $ sudo apt-get instal…

2023年4月8日
000
卷积神经网络

CNN卷积神经网络_深度残差网络 ResNet——解决神经网络过深反而引起误差增加的根本问题，Highway NetWork 则允许保留一定比例的原始输入 x。（这种思想在inception模型也有，例如卷积是concat并行，而不是串行）这样前面一层的信息，有一定比例可以不经过矩阵乘法和非线性变换，直接传输到下一层，仿佛一条信息高速公路，因此得名Highway Network

from:https://blog.csdn.net/diamonjoy_zone/article/details/70904212 环境：Win8.1 TensorFlow1.0.1 软件：Anaconda3 （集成Python3及开发环境） TensorFlow安装：pip install tensorflow (CPU版) pip install te…

2023年4月8日
000

合作推广

合作推广

返回顶部