机器学习（西瓜书）——模型评估与选择

2023年4月13日下午10:58 • 机器学习

yizhihongxing

1、评估标准

　　1）经验误差：训练集上产生的误差

　　2）泛化误差：对新样本进行预测产生的误差

　　3）过拟合：经验误差很小甚至为零，泛化误差很大（模型训练的很复杂，几乎涵盖了训练集中所有的样本点）

　　4）欠拟合：与过拟合相反

　　一般模型的泛化误差越小越好

2、评估方法

　　1）留出法：采用分层采样的方式留出验证集

　　2）交叉验证法：将数据集均分k份，留出一份作为交叉验证集，重复k次取均值

　　3）自助法：随机可重复采样m次，所得集合作为训练集，余下数据作为验证集

　　在数据集较小时，自助法比较可靠在数据集较大时，留出法和交叉验证法更常用一些

3、调参与最终模型

　　1）调参：调整模型输入参数，使得结果接近最佳，如果计算资源允许，可通过枚举方式进行

　　2）在模型选择完成后，学习算法和参数配置已选定，此时应该用数据集D重新训练模型

4、性能度量

　　回归任务中最常用的性能度量是均方误差

　　1）错误率与精度

　　2）查准率（precision）与查全率（recall）

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习（西瓜书）——模型评估与选择 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

python大战机器学习——数据降维

上一篇 2023年4月13日

python大战机器学习——人工神经网络

下一篇 2023年4月13日

使用卷积神经网络CNN训练识别mnist

算的的上是自己搭建的第一个卷积神经网络。网络结构比较简单。输入为单通道的mnist数据集。它是一张28*28，包含784个特征值的图片我们第一层输入，使用5*5的卷积核进行卷积，输出32张特征图，然后使用2*2的池化核进行池化输出14*14的图片第二层使用5*5的卷积和进行卷积，输出64张特征图，然后使用2*2的池化核进行池化输出7*7的图片第…

卷积神经网络 2023年4月8日
000
pytorch简单测试

pytorch demo import torch.nn as nn import torch.nn.functional as F from torch.autograd import Variable import torch import torch.optim as optim class Net(nn.Module):#需要继承这个类 def __…

PyTorch 2023年4月6日
000
卷积神经网络

OpenCV在矩阵上的卷积

转载请注明出处！！！http://blog.csdn.net/zhonghuan1992 在openCV官网上说是戴面具，事实上就是又一次计算一下矩阵中的每个value，那么怎么计算呢，依据该像素点的周围信息，用一个加权的公式来进行计算。那么如今就要看，周围的信息是怎样被加权的。让我们想一下这种方式，请看以下的公式： …

2023年4月8日
000
ubuntu系统—ubuntu16.04 + virtualenv + py2.7 + tf1.5.0 + keras2.2.4 + opencv2.4.9 +Numpy1.14

　　　　　　　ubuntu16.04 + virtualenv + py2.7 + tf1.5.0 + keras2.2.4 + opencv2.4.9 +Numpy1.14 @https://www.liaoxuefeng.com/wiki/1016959663602400/1019273143120480@https://msd.misuland.com…

Keras 2023年4月6日
000
84、循环神经网络实现语言模型

”’ Created on 2017年5月13日 @author: weizhen ”’ import numpy as np import tensorflow as tf import ptb_iterator as reader from tensorflow.contrib import rnn DATA_PATH = “/path/to/ptb…

循环神经网络 2023年4月5日
000
TensorFlow中assign函数

tf.assign assign ( ref , value , validate_shape = None , use_locking = None , name = None ) 定义在：tensorflow/python/ops/state_ops.py 参见指南：变量>变量帮助函数通过将 “value” 赋给 “ref” 来更新 “ref”.…

tensorflow 2023年4月6日
000
目标检测的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练

将目标检测的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练。 import xml.etree.ElementTree as ET import numpy as np import os import tensorflow as tf from PIL import Image classes = [“aeropl…

目标检测 2023年4月5日
000
tensorflow

Tensorflow 模型的保存、读取和冻结、执行

转载自https://www.jarvis73.cn/2018/04/25/Tensorflow-Model-Save-Read/ 本文假设读者已经懂得了 Tensorflow 的一些基础概念, 如果不懂, 则移步 TF 官网 . 在 Tensorflow 中我们一般使用 tf.train.Saver() 定义的存储器对象来保存模型, 并得到形如下面列表的文…

2023年4月6日
000

合作推广

合作推广

返回顶部