机器学习（西瓜书）——模型评估与选择

2023年4月13日下午10:58 • 机器学习

1、评估标准

　　1）经验误差：训练集上产生的误差

　　2）泛化误差：对新样本进行预测产生的误差

　　3）过拟合：经验误差很小甚至为零，泛化误差很大（模型训练的很复杂，几乎涵盖了训练集中所有的样本点）

　　4）欠拟合：与过拟合相反

　　一般模型的泛化误差越小越好

2、评估方法

　　1）留出法：采用分层采样的方式留出验证集

　　2）交叉验证法：将数据集均分k份，留出一份作为交叉验证集，重复k次取均值

　　3）自助法：随机可重复采样m次，所得集合作为训练集，余下数据作为验证集

　　在数据集较小时，自助法比较可靠在数据集较大时，留出法和交叉验证法更常用一些

3、调参与最终模型

　　1）调参：调整模型输入参数，使得结果接近最佳，如果计算资源允许，可通过枚举方式进行

　　2）在模型选择完成后，学习算法和参数配置已选定，此时应该用数据集D重新训练模型

4、性能度量

　　回归任务中最常用的性能度量是均方误差

　　1）错误率与精度

　　2）查准率（precision）与查全率（recall）

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习（西瓜书）——模型评估与选择 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

python大战机器学习——数据降维

上一篇 2023年4月13日

python大战机器学习——人工神经网络

下一篇 2023年4月13日

卷积神经网络

Deep Learning系统实训之三：卷积神经网络

边界填充（padding）：卷积过程中，越靠近图片中间位置的像素点越容易被卷积计算多次，越靠近边缘的像素点被卷积计算的次数越少，填充就是为了使原来边缘像素点的位置变得相对靠近中部，而我们又不想让填充的数据影响到我们的计算结果，故填充值选择均用0来填充。池化层不需要参数、只是对特征图进行压缩操作，以减少计算量：池化几乎不用平均池化，多用最大池化操作，对于…

2023年4月8日
000
GAN生成对抗网络

生成对抗网络（GAN Generative Adversarial Nets ）简介

常见神经网络形式神经网络分很多种, 有普通的前向传播神经网络 , 有分析图片的 CNN 卷积神经网络 , 有分析序列化数据, 比如语音的 RNN 循环神经网络 , 这些神经网络都是用来输入数据, 得到想要的结果, 我们看中的是这些神经网络能很好的将数据与结果通过某种关系联系起来. 生成网络但是还有另外一种形式的神经网络, 他不是用来把数据对应上结果的…

2023年4月6日
000
目标检测

小样本目标检测–Meta-RCNN论文阅读

目录介绍网络框架数据集准备创新点损失函数训练和测试过程实验结论介绍网络框架数据集准备 L（训练集）分为support set和Query set，对于第i次任务，K ways和N images随机从Lc中选择，建立成 S（测试集，与L没有类别重合）创新点损失函数训练和测试过程实验结论

2023年4月8日
000
Caffe

Caffe学习记录(十) SegNet等分割网络学习

图像分割作为计算机视觉的一个方向，广泛应用在各个领域，记录一下学习的过程，以及各个网络的优缺点，不同的地方等。最流行的方法是FCN，整个分割的流程大致可以看做如下： FCN顾名思义，全卷机网络，就是把fc层都换做1×1的卷积层，channel等价于fc层的输出个数。 FCN的架构为编码器，和解码器组成，编码器阶段为卷积+池化的下采样过程，解码器阶段为卷…

2023年4月8日
000
Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱 NLPJob 曾经因为NLTK的缘故开始学习Python，之后渐渐成为我工作中的第一辅助脚本语言，虽然开发语言是C/C++，但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后，第一个作品课程图谱也是选择了Python系的Fl…

机器学习 2023年4月13日
000
Keras

keras运行报错ValueError: Graph disconnected: cannot obtain value for tensor Tensor

keras运行报错ValueError: Graph disconnected: cannot obtain value for tensor Tensor(“input_1:0”, shape=(?, 64, 64, 3), dtype=float32) at layer “input_1”. The following previous layers w…

2023年4月8日
000
tensorflow

利用Tensorflow进行自然语言处理（NLP）系列之二高级Word2Vec

本篇也同步笔者另一博客上（https://blog.csdn.net/qq_37608890/article/details/81530542）一、概述在上一篇中，我们介绍了Word2Vec即词向量，对于Word Embeddings即词嵌入有了些基础，同时也阐述了Word2Vec算法的两个常见模型：Skip-Gram模型和CBOW模…

2023年4月8日
000
Caffe CommonLayer分析

Caffe CommonLayer分析 \(Caffe\)中包含了很多通用的功能层，包含了\(concat\),\(slice\),\(split\),\(crop\),\(flip\),\(scale\_layer\)等,这些层在网络中经常被使用，本文也将对其中的常见layer进行说明与源码分析。 \(Layer\) \(CropLayer\) CropL…

Caffe 2023年4月8日
000

合作推广

合作推广

返回顶部