《机器学习基石》—逻辑回归

2023年4月12日下午10:22 • 机器学习

（注：本文内容和图片来源于林轩田老师的《机器学习基石》课程）

通常的二分类问题，希望输出类别；soft的二分类问题，希望输出概率值：

《机器学习基石》---逻辑回归

《机器学习基石》---逻辑回归

对于soft问题的理想数据和实际数据：

《机器学习基石》---逻辑回归

逻辑回归的思想：先求出特征的线性加权分数，再把它用逻辑斯蒂函数转化为0～1之间的值：

《机器学习基石》---逻辑回归

逻辑斯蒂函数介绍：

《机器学习基石》---逻辑回归

2 逻辑回归的损失函数

最大似然：将训练集产生的概率最大化：

《机器学习基石》---逻辑回归

运用逻辑斯蒂函数的性质：

《机器学习基石》---逻辑回归

可以得到：

《机器学习基石》---逻辑回归

因此问题就变为，选择合适的逻辑回归模型h，使得似然函数最大化：
《机器学习基石》---逻辑回归

把逻辑回归模型代进去，具体来说，就是：

《机器学习基石》---逻辑回归

两边取对数：

《机器学习基石》---逻辑回归

《机器学习基石》---逻辑回归

最后得到最终形式：
《机器学习基石》---逻辑回归

3 最小化损失函数

现在的问题是：

《机器学习基石》---逻辑回归

3.1 求损失函数的梯度

《机器学习基石》---逻辑回归

3.2 梯度下降法的推导

用迭代来求最优化问题，如下（其中v是一个单位向量）：

《机器学习基石》---逻辑回归

梯度下降的思想是：每次更新完以后，函数值尽可能下降到最低。因此相当于：

《机器学习基石》---逻辑回归

将式子泰勒展开：
《机器学习基石》---逻辑回归

则最小化问题变为：
《机器学习基石》---逻辑回归

前面一项是已知的，为了将最后一项向量内积最小化，v应该等于：

《机器学习基石》---逻辑回归（即与梯度相反，再单位化）

η的选择：

《机器学习基石》---逻辑回归

因此η应该随梯度动态变化，假设η正比于梯度的大小：

《机器学习基石》---逻辑回归

因此，我们就能得到最后的形式。

4 逻辑回归学习算法

《机器学习基石》---逻辑回归

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：《机器学习基石》—逻辑回归 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

《机器学习技法》—核型逻辑回归

上一篇 2023年4月12日

《机器学习基石》—理解机器为什么能学习（一）

下一篇 2023年4月12日

我对卷积神经网络的一点粗浅的理解

Convolutional Neural Network，卷积神经网络，简称CNN，最近几年再次流行起来。 CNN和普通的机器学习算法有什么相同，有什么不同？简单说，CNN=A+B，即CNN包括两个方面的功能： A：feature extactor 特征提取器普通的机器学习算法，比如决策树、随机森林、svm、逻辑回归/softmax等，它的输入通常就是若…

卷积神经网络 2023年4月8日
000
人工智能AI图像风格迁移(StyleTransfer),基于双层ControlNet(Python3.10)

图像风格迁移（Style Transfer）是一种计算机视觉技术，旨在将一幅图像的风格应用到另一幅图像上，从而生成一幅新图像，该新图像结合了两幅原始图像的特点，目的是达到一种风格化叠加的效果，本次我们使用Stable-Diffusion结合ControlNet来实现图像风格迁移效果。安装ControlNet插件首先确保本地已经安装并且配置好了Stable…

人工智能概论 2023年4月22日
000
[winograd]winograd算法在卷积中的应用

在卷积神经网络当中, 卷积运算是尤其是计算敏感的, 尤其是在端上设备中, 对于性能的要求更为苛刻。对于卷积优化的方法也有很多种，本文便针对近年来最常见的优化方法Winograd做一个简单总结。相关资料 winograd算法最早是1980年由Terry Winograd提出的，当时并没有引起太大的轰动。在CVPR’16会议上，Lavin等人[1]提出了利用w…

卷积神经网络 2023年4月6日
000
tensorflow

TensorFlow—多层感知器—MNIST手写数字识别

1 import tensorflow as tf 2 import tensorflow.examples.tutorials.mnist.input_data as input_data 3 import matplotlib.pyplot as plt 4 import numpy as np 5 mnist=input_data.read_data_…

2023年4月6日
000
Caffe

【caffe Net】使用举例和代码中文注释

首先是Net使用的小例子： #include <vector> #include <iostream> #include <caffe/net.hpp> using namespace std; using namespace caffe; int main() { std::string proto(“./bamboo…

2023年4月8日
000
Keras

Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本）安装教程

Keras python深度学习的库 conda create -n py3.5.4tf1.5keras2.1.4 python=3.5.4 创建环境 activate py3.5.4tf1.5keras2.1.4 进入环境按照CPU版本的keras. 我建议大家先按照CPU版本的keras。因为在windows按照GPU版本的keras比较复杂，初学者…

2023年4月8日
000
目标检测

【CV】目标检测的常用数据处理方法

【CV】目标检测的常用数据处理方法！机器学习初学者今天以下文章来源于Datawhale ，作者徐和鼎 Datawhale 一个专注于AI领域的开源组织，汇集了众多领域院校和知名企业的优秀学习者，聚合了一群有开源精神和探索精神的团队成员。愿景-for the learner，和学习者一起成长。作者：徐和鼎，浙江大学，Datawhale优秀学习者前…

2023年4月8日
000
目标检测

目标检测之Faster R-CNN通俗详解

算法简介我们都知道，Fast R-CNN虽然提高了目标检测算法质的飞跃，但是在Fast R-CNN中仍然存在很大的瓶颈，那就是候选框选取特别耗时的问题，而Faster R-CNN恰恰就是在这一问题上的解决方案。关于Faster R-CNN，是rgb在2015年提出，他将proposal的提取、特征提取、boundingbox回归和分类都放到一个网络中，提高了…

2023年4月8日
000

合作推广

合作推广

返回顶部