Andrew Ng机器学习算法入门(四):阶梯下降算法

2023年4月9日下午11:52 • 机器学习

梯度降级算法简介

之前如果需要求出最佳的线性回归模型，就需要求出代价函数的最小值。在上一篇文章中，求解的问题比较简单，只有一个简单的参数。梯度降级算法就可以用来求出代价函数最小值。
梯度降级算法的在维基的定义:

梯度下降法是一个一阶最优化算法，通常也称为最速下降法。要使用梯度下降法找到一个函数的局部极小值，必须向函数上当前点对应梯度（或者是近似梯度）的反方向的规定步长距离点进行迭代搜索

首先，复习一下之前前面的讲过求解最佳的代价函数的过程

Andrew Ng机器学习算法入门(四):阶梯下降算法

那么如何通过梯度降级算法解决这个问题呢？首先对θ0和θ1进行初始化，初始化的值是什么并不重要，但通常的选择是将它们都初始化为0。我们在梯度下降算法中要做的，就是不停地一点点地改变θ0和θ1，试图通过这种改变使得J(θ0, θ1)变小，直到我们找到J的最小值，这个最小值就是一个局部最优解。
求解的过程可能如下：

Andrew Ng机器学习算法入门(四):阶梯下降算法

最上面的点是起始点，就加上如同一个人站在起始点的位置，最后需要回到最低点的位置，就需要一步步地向下走

梯度降级算法定义

梯度降级算法的定义如下：
Andrew Ng机器学习算法入门(四):阶梯下降算法

:=表示的就是赋值语句
a，学习速率，表示的是在每一步的步长。在上面的例子中，稼穑你是一个人需要从山顶下山，那么a表示的就是你每一步的长度
后面的数学公式就是一个数学公式，是一个偏导数。

需要注意一点的是，需要同时更新所有的theta参数，包括theta-0，theta-1。这个其实在偏导数里面也是一个最基本的常识了，这里不作过多的讲解。如果你不了解，那只要记住就可以了。
下面的这个例子就是错误的，不是同时更新的。
Andrew Ng机器学习算法入门(四):阶梯下降算法

为了能够形象地说明梯度讲解算法的用法，那么我们简化梯度讲解算法，假设仅仅只存在一个参数theta-1。
通过在第三节中讲述的，J(θ1)的图形就是一个曲线。利用阶梯降级函数的定义
Andrew Ng机器学习算法入门(四):阶梯下降算法

那么最后的求解过程为：
Andrew Ng机器学习算法入门(四):阶梯下降算法

这样就找到了最优解，和第三节中得到的最优解也是一样的。
需要注意的问题是，学习速率a的设置既不能太大也不能太小，否则就会出现下面的问题。
Andrew Ng机器学习算法入门(四):阶梯下降算法

如果a太小，那么寻找最优解的时间过长；如果a太大，那么有可能无法找到最优解。

梯度降级算法在线性回归中的应用

下面还是简单的给出梯度降级算法和线性回归的算法定义
Andrew Ng机器学习算法入门(四):阶梯下降算法

为了方便对算法的求解进行描述，我们还是假设仅仅只是存在θ1和θ2
将右边定义的J(θ)导入到左边的梯度降级算法中，得到如下的结果：
Andrew Ng机器学习算法入门(四):阶梯下降算法

但是需要注意的是，在仅仅只是存在θ1和θ2的情况下，代价函数的图形为：
Andrew Ng机器学习算法入门(四):阶梯下降算法

是一个凹图像，这个之前说的是不一致的。之前的那个图像仅仅是为了表述方面而作的图。
最后将3D图转换为轮廓图，得到最后的最小的代价函数如下：
Andrew Ng机器学习算法入门(四):阶梯下降算法

以上就是梯度降级算法在线性回归中的应用

批梯度下降算法

批梯度下降算法的定义就是，在每一步的梯度下降过程中，使用所有的训练样本。当然还有一些算法仅仅只是使用部分的训练样本。目前讨论的都是使用所有的训练样本。

为了能到远方，脚下的每一步都不能少

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Andrew Ng机器学习算法入门(四):阶梯下降算法 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

机器学习相关数据库（转）

上一篇 2023年4月9日

Andrew Ng机器学习算法入门((六):多变量线性回归方程求解

下一篇 2023年4月9日

【机器学习】：Kmeans均值聚类算法原理(附带Python代码实现)

这个算法中文名为k均值聚类算法，首先我们在二维的特殊条件下讨论其实现的过程，方便大家理解。第一步.随机生成质心由于这是一个无监督学习的算法，因此我们首先在一个二维的坐标轴下随机给定一堆点，并随即给定两个质心，我们这个算法的目的就是将这一堆点根据它们自身的坐标特征分为两类，因此选取了两个质心，什么时候这一堆点能够根据这两个质心分为两堆就对了。如下图所示： …

机器学习 2023年4月13日
000
白话机器学习的数学笔记系列8代码实现_一元回归

先发这几个吧，其他的等有空再编辑好发出来…欢迎大家指出我的错误哈~

机器学习 2023年4月12日
000
python大战机器学习——支持向量机

　　支持向量机（Support Vector Machine，SVM）的基本模型是定义在特征空间上间隔最大的线性分类器。它是一种二类分类模型，当采用了核技巧之后，支持向量机可以用于非线性分类。　　1）线性可分支持向量机（也称硬间隔支持向量机）：当训练数据线性可分是，通过硬间隔最大化，学得一个线性可分支持向量机　　2）线性支持向量机（也称为软间隔支持向量机…

机器学习 2023年4月13日
000
机器学习之路–Numpy

ndarray.dtype 数据类型必须是一样的常用代码 import numpy #numpy读取文件 world_alcohol = numpy.genfromtxt(“world_alcohol.txt”, delimiter=”,”, dtype=str, skip_header=1) #<class ‘numpy.ndarray’> …

机器学习 2023年4月13日
000
机器学习-分类算法-逻辑回归

# -*- coding: utf-8 -*- “”” Spyder Editor This is a temporary script file. “”” import matplotlib.pyplot as plt import numpy as np from sklearn.model_selection import train_test_s…

机器学习 2023年4月12日
000
【机器学习入门与实践】数据挖掘-二手车价格交易预测（含EDA探索、特征工程、特征优化、模型融合等）

【机器学习入门与实践】数据挖掘-二手车价格交易预测（含EDA探索、特征工程、特征优化、模型融合等）【机器学习入门与实践】数据挖掘-二手车价格交易预测（含EDA探索、特征工程、特征优化、模型融合等） note：项目链接以及码源见文末 1.赛题简介了解赛题赛题概况数据概况预测指标分析赛题数据读取pandas 分类指标评价计算示例回归指标评价计算示…

机器学习 2023年4月14日
000
机器学习

跟我学机器视觉-HALCON学习例程中文详解-IC引脚测量

跟我学机器视觉-HALCON学习例程中文详解-IC引脚测量 Lead Measurement: Example for the application of the measure object including a lot of visualization operators. First, the length of the leads is meas…

2023年4月9日
000
机器学习笔记5：决策树

目录决策树公式 1.信息熵 2.条件熵 3.信息增益 4. 信息熵举例 5. 信息增益举例决策树举例表格预设手动计算决策树特征的重要性随机森林集成学习随机性体现在两点：有两个优势：决策树公式 1.信息熵 \[H(X)=-\sum_{i=1}^{n}P(X=i)log_{2}P(X=i) \] 2.条件熵 \[H(X|Y)=-\sum_{…

机器学习 2023年4月13日
000

合作推广

合作推广

返回顶部