深度学习7softmax回归

2023年4月11日上午2:11 • 深度学习

yizhihongxing

softmax回归可以解决两种以上的分类，该模型是logistic回归模型在分类问题上的推广。

对于y可以取两个以上的值，比如说判断一份邮件是垃圾邮件、个人邮件还是工作邮件。

这边也参考http://deeplearning.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92

即，对于训练集，我们有

也就是对于给定的输入x，我们想用假设函数针对每一个类别j估算p(y=j|x)，也就是估算出每一种分类结果出现的概率。对于logistic回归中，y取0跟1，我们采用假设函数我们将训练模型参数，使其能够最小化代价函数：

就是这边为什么乘以-1/m

而在softmax回归中，y取多个值k，因此，我们的假设函数将要输出一个维的向量（向量元素的和为1）来表示这个估计的概率值。具体地说，我们的假设函数形式如下：

下面就看看这个是怎么来的。

首先定义每个结果的概率，

则有，这样我也就可以把最后一个概率用前面几项表示，即

则，这个问题我们可以看成事k-1维的问题。则这个时候的T(y)就不是y，而是一组k-1维的向量，也就是T(y)要给出每一个y=i的概率（i从1到k-1）对于这个问题也演化到一般线性模型上面，即

将这多个向量也转化到指数分布上。下面定义:

用表示第i个向量，第i为1，其他为0，符号表示

，

另外我们有

好，下面我们的目的也就是使得每个在其i时的概率最大，转化到一般线性模型下，即

则：

则对于每一个有

这边，接着有

则，带入得到

从η到φ我们就叫做softmax回归。

这样我们就得到了上面的假设函数，换个写法

下面再反过来求最大似然估计

最后我们再用牛顿法或者梯度下降法解出θ

整个过程有了，但是还没有能够进行深入理解，对于更多细节参考

http://deeplearning.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92

下面做一下这个后面的练习来加深理解。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习7softmax回归 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

深度学习6一般线性模型

上一篇 2023年4月11日

深度学习5牛顿法

下一篇 2023年4月11日

深度学习识别CIFAR10：pytorch训练LeNet、AlexNet、VGG19实现及比较（二）

版权声明：本文为博主原创文章，欢迎转载，并请注明出处。联系方式：460356155@qq.com AlexNet在2012年ImageNet图像分类任务竞赛中获得冠军。网络结构如下图所示：对CIFAR10，图片是32*32，尺寸远小于227*227，因此对网络结构和参数需做微调：卷积层1：核大小7*7，步长2，填充2 最后一个max-pool层删除 …

深度学习 2023年4月13日
000
卷积神经网络CNN与深度学习常用框架的介绍与使用

一、神经网络为什么比传统的分类器好 1.传统的分类器有 LR（逻辑斯特回归）或者 linear SVM ，多用来做线性分割，假如所有的样本可以看做一个个点，如下图，有蓝色的点和绿色的点，传统的分类器就是要找到一条直线把这两类样本点分开。对于非线性可分的样本，可以加一些kernel核函数或者特征的映射使其成为一个曲线或者一个曲面将样本分开。但为什么效果不好…

深度学习 2023年4月12日
000
深度学习

深度学习之Transformer网络

【博主使用的python版本：3.6.8】本次没有额外的资料下载 Packages ort tensorflow as tf import pandas as pd import time import numpy as np import matplotlib.pyplot as plt from tensorflow.keras.layers impo…

2023年4月10日
000
【深度学习笔记】第 4 课：模型性能评估

training set 训练集　　validation set 验证集　　test set测试集这些与衡量你做的怎么样有关当你知道怎么衡量你在一个问题的表现，问题就解决了一半。（衡量表现的重要性）每个你将建立的分类器都会尝试记住训练集，并且它通常在这方面会做的很好很好你的工作是帮助它泛化到新的数据上所以我们怎么用测量泛化能力代替测量分类其记住…

深度学习 2023年4月13日
000
ubuntu搭建深度学习环境

ubuntu如何搭建深度学习环境的详细步骤安装vscode 方法一：依次输入如下命令 1.sudo add-apt-repository ppa:ubuntu-desktop/ubuntu-make 2.sudo apt-get update 3.sudo apt-get install ubuntu-make 4.umake ide visual-st…

深度学习 2023年4月14日
000
深度学习小记

0 前言近段时间，由于工作需要，一直在看深度学习的各种框架，主要是Caffe和Tensorflow。并且在可预见的未来，还会看更多不同的深度学习框架。最开始我是以软件工程师的角度去阅读这些框架的，说实话，Caffe的代码框架逻辑清晰相对好理解一点，而TensorFlow就比较麻烦了，里面内容太多，函数调用链非常长，且使用了大量的C++11语法，这对于C++…

深度学习 2023年4月13日
000
【神经网络与深度学习】如何将别人训练好的model用到自己的数据上

caffe团队用imagenet图片进行训练，迭代30多万次，训练出来一个model。这个model将图片分为1000类，应该是目前为止最好的图片分类model了。假设我现在有一些自己的图片想进行分类，但样本量太小，可能只有几百张，而一般深度学习都要求样本量在1万以上，因此训练出来的model精度太低，根本用不上，那怎么办呢？那就用caffe团队提供给我…

深度学习 2023年4月13日
000
深度学习

深度学习常见的优化方法(Optimizer)总结:Adam,SGD,Momentum,AdaGard等

原文：https://www.cnblogs.com/GeekDanny/p/9655597.html 基础知识: 机器学习几乎所有的算法都要利用损失函数 lossfunction 来检验算法模型的优劣，同时利用损失函数来提升算法模型．这个提升的过程就叫做优化(Optimizer) 下面这个内容主要就是介绍可以用来优化损失函数的常用方法常用的优化方法(O…

2023年4月10日
000

合作推广

合作推广

返回顶部