机器学习中常见的损失函数

2023年4月10日上午2:06 • 机器学习

## 机器学习中常见的损失函数一般来说，我们在进行机器学习任务时，使用的每一个算法都有一个目标函数，算法便是对这个目标函数进行优化，特别是在分类或者回归任务中，便是使用损失函数（Loss Function）作为其目标函数，又称为代价函数(Cost Function)。损失函数是用来评价模型的预测值

\hat{Y} = f (X)

L=\sumi=1Nℓ(yi,yi^)

$\hat{Y} = f (X)$

ℓ(yi,yi^)={1,yi≠yi^0,yi=yi^

$\hat{Y} = f (X)$

ℓ(yi,yi^)={1,|yi−yi^|>t0,|yi−yi^|≤t

$\hat{Y} = f (X)$

ℓ(yi,yi^)=max{0,1−yi⋅yi^}

yi\in{-1,+1}

$\hat{Y} = f (X)$

ℓ(yi,yi^)=yi\cdotlogyi^+(1-yi)\cdotlog(1-yi^)

yi\in{0,1}

$\hat{Y} = f (X)$

0\cdotlog\cdot=0

$\hat{Y} = f (X)$

ℓ(yi,yi^)=(yi-yi^)2

yi,yi^\inℜ

$\hat{Y} = f (X)$

ℓ(yi,yi^)=|yi-yi^|

yi,yi^\inℜ

$\hat{Y} = f (X)$

ℓ(yi,yi^)=exp(-yi\cdotyi^)

yi\in{-1,1}

正则

一般来说，对分类或者回归模型进行评估时，需要使得模型在训练数据上使得损失函数值最小，即使得经验风险函数最小化，但是如果只考虑经验风险(Empirical risk)，容易过拟合(详细参见防止过拟合的一些方法)，因此还需要考虑模型的泛化能力，一般常用的方法便是在目标函数中加上正则项，由损失项(Loss term)加上正则项(Regularization term)构成结构风险(Structural risk)，那么损失函数变为：

L=\sumi=1Nℓ(yi,yi^)+λ\cdotR(ω)

$\hat{Y} = f (X)$

各损失函数图形如下：

机器学习中常见的损失函数

版权声明：未经许可, 不能转载 https://blog.csdn.net/heyongluoyao8/article/details/52462400

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习中常见的损失函数 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

解读机器学习基础概念：VC维的来龙去脉 | 数盟

上一篇 2023年4月10日

【机器学习】模型融合方法概述

下一篇 2023年4月10日

常用的数据挖掘&机器学习知识(点)

Basis(基础)： MSE(MeanSquare Error 均方误差)，LMS(Least MeanSquare 最小均方)，LSM(Least Square Methods 最小二乘法)，MLE(Maximum LikelihoodEstimation最大似然估计)，QP(QuadraticProgramming 二次规划)， CP(Condition…

机器学习 2023年4月13日
000
又拍云之 Keepalived 高可用部署

在聊 Keepalived 之前，我们需要先简单了解一下 VRRP。VRRP（Virtual Router Redundancy Protocol）即虚拟路由冗余协议，是专门为了解决静态路由的高可用而设计的。简单说下它的工作原理：虚拟路由器由多个路由器组成，每个路由器都有各自的 IP 和共同的 VRID(0-255)，其中一个 VRRP 路由器通过竞选成为…

机器学习 2023年4月11日
000
Pinterest凭什么拥有那么多用户:机器学习是答案

目前，Pinterest月平均活跃用户量达到1亿，这家以图片为主的公司是如何留住用户并盈利的呢？Pinterest的主要目标是向用户推荐相关的图片或内容，推荐的内容足够精确才能提高用户黏性。近期，《快公司》发文表示，Pinterest 正从机器学习切入，向用户推荐更精准的内容，并拓展新的在线业务。在Pinterest 平台上，人们可以搜索、下载全网范围内的…

机器学习 2023年4月12日
000
机器学习之路–KNN算法机器学习实战之kNN算法

机器学习实战这本书是基于python的，如果我们想要完成python开发，那么python的开发环境必不可少：（1）python3.52,64位，这是我用的python版本（2）numpy 1.11.3,64位，这是python的科学计算包，是python的一个矩阵类型，包含数组和矩阵，提供了大量的矩阵处理函数，使运算更加容易，执行更加迅速…

机器学习 2023年4月13日
000
机器学习模型为什么要将特征离散化（转）

我在刷Kaggle时发现一个问题。很多人在处理数据的时候，经常把连续性特征离散化。对此我感到很好奇，所以上网搜了一些总结，主要内容来自知乎连续特征的离散化：在什么情况下将连续的特征离散化之后可以获得更好的效果？这个是严林的回答在工业界，很少直接将连续值作为逻辑回归模型的特征输入，而是将连续特征离散化为一系列0、1特征交给逻辑回归模型，这样做的优势有以下几点…

机器学习 2023年4月12日
000
数据挖掘和机器学习的基本概念

数据预处理：聚集、抽样、维度归约、属性选择、属性创建、离散化和二元化、变量变换。分类和回归：分类和回归是数据挖掘领域的重要技术。分类就是在已有的数据的基础上学习出一个分类函数或构造出一个分类模型，这是通常所说的分类器。分类预测出目标是离散值，回归预测输出连续值。分类器模型:决策树分类、贝叶斯分类、K-最近邻分类、神经网络分类。聚类分析：划分的方法、层…

机器学习 2023年4月12日
000
机器学习

【机器学习】模型融合方法概述

我理解的Kaggle比赛中提高成绩主要有3个地方特征工程调参模型融合之前每次打比赛都只做了前两部分，最后的模型融合就是简单的加权平均，对于进阶的Stacking方法一直没尝试，这几天摸索了一下还是把Stacking方法给弄懂了。(本文重点讲解Stacking,Bagging和Boosting有很多权威的好教程，所以不详细介绍)最早的Stackin…

2023年4月10日
000
机器学习

机器学习中的数学基础_七月算法4月机器学习班第1次课程笔记

2016/5/8 星期日 12:36 desc 目标函数选择基尼系数，熵（条件熵，交叉熵），分类误差率都可以作为目标函数用凸函数的方法证明 KL距离一定大于0 D(p||q) = Σplog(p/q) = -Σplog(q/p) 因为 -log 是凸函数，且Σp=1，所以上式 >= -log(Σp·q/p) = -log(Σq) …

2023年4月9日
000

合作推广

合作推广

返回顶部