机器学习公开课笔记第二周，线性回归的梯度下降法

2023年4月11日上午1:43 • 机器学习

一，梯度下降法Gradient Decent

当我们以线性回归的模型来拟合我们的数据集时，我们如何来确定假设函数的参数值呢？

首先我们以两个参数为例，即H_θ(x) = θ₀ + θ₁X，也就是一个一次函数，而代价函数机器学习公开课笔记第二周，线性回归的梯度下降法，我们为了尽量拟合数据集，也就是选择合适的θ₀（截距）_， θ₁(斜率)使代价函数J(θ_0，θ₁)最小，

机器学习公开课笔记第二周，线性回归的梯度下降法

那我们该如何计算θ_0， θ₁？

假设θ₀=0，代价函数J就转变为关于θ₁的二次函数，因为开平方，所以二次项的系数一定是正数(高中数学)，所以代价函数J一定有最小值

此时我们可以画出J(θ₁₎的一种可能的二次函数分布图

机器学习公开课笔记第二周，线性回归的梯度下降法

由图可知，当θ₁=1时，J最小

那我们如何得到使J最小的θ₁值呢？

我们可以任取曲线上的一个θ，让它往最小值的方向移动，那我们怎么知道该往左移还是右移？

我们观察曲线发现，最低点(最小值)的斜率为0，最低点的左侧斜率小于0，右侧大于0，只需让θ减去该点的斜率就可以让它往最低点移动，当斜率为0时它就停在了最低点，也就是收敛于1

机器学习公开课笔记第二周，线性回归的梯度下降法

如果θ0一开始不设为0呢？

那我们可以画出关于代价函数J(θ₁,θ₂)的三维图

机器学习公开课笔记第二周，线性回归的梯度下降法

我们同样选取任意一点(θ₁,θ₂)，通过减去他们各自的在该点的斜率来到打最低点

数学上称这种求自求点斜率的方法为偏导，这种通过减去斜率的方法称为梯度下降法(Gradient Decent)

机器学习公开课笔记第二周，线性回归的梯度下降法

那我们如何确定向最低点移动的速度呢？

一方面是由该点的斜率来决定，另外由一个系数α学习速率决定，

1，α不能设太大，太大有时会越过最低点，不能使θ_j收敛于最低点使结果发散

2，α太小会使程序运行速度太慢

3，随着θ越来越接近最小值，偏导数越来越小，所以没有必要逐渐随着迭代次数的增加减小学习速率α

机器学习公开课笔记第二周，线性回归的梯度下降法

　　对每次的移动必须同时进行，并和成各个方向上的位移，即每一次减偏导必须对每个θj同时进行

机器学习公开课笔记第二周，线性回归的梯度下降法

两个参数的线性回归求完偏导数之后每次迭代的公式

多个参数的线性回归求完偏导数之后每次迭代的公式

机器学习公开课笔记第二周，线性回归的梯度下降法

梯度下降法会到达局部最低点(由起点决定，即θ₁和θ₂的初始值决定)，不一定会到达全局最优点

二，梯度下降法的优化方法

1，特征缩放(Feature Scaling)

当不同的特征值大小范围不一致时，算法运行效率会很低，我们一般把它缩放到-1<=x<=1或,-0.5<=x<=0.5，通过(x-mean)/range公式，

机器学习公开课笔记第二周，线性回归的梯度下降法

2，学习速率α

如何确定学习速率并不是一件简单的事

一种方式是绘制一张横坐标是迭代次数，纵坐标是代价函数的函数图，看是否单调递减，如不是需要减小学习速率α

机器学习公开课笔记第二周，线性回归的梯度下降法

总的来说，学习速率太小，代价函数收敛太慢，程序云星很慢，学习太大，代价函数没有单调递减，甚至可能会发散，也就到不了最小值

3，特征和多项式回归（Features and Polynomial Regression）

当我们拿到数据集先可以进行预处理，使机器学习的结果更好

1）我们有时可以根据各个特征之间关系来合并特征，比如说房子的长度和宽度，我们可以让他们相乘合成一个新的特征面积

2) 我们之前线性回归的假设函数都是多元一次函数，如果我们的想要多元多次的假设函数呢？H_θ(x) = θ₀ + θ₁X², 我们可以用新的特征来表示X'来表示X²,一样能转化为多元一次表示假设函数H_θ(x) = θ₀ + θ₁X'，

　　不过需要注意的事，X的范围也随着新的特征放大了，要进行特征缩放

4，正规方程(Normal Equation)

还有一种在线性代数中叫做正规方程的数学方法求θ

机器学习公开课笔记第二周，线性回归的梯度下降法

梯度下降法和正规方程各有各的优点，以下是他们的区别，总的来说，

1，梯度下降法需要选择学习速率，正规方程不需要

2，梯度下降法需要迭代，正规方程不需要

3，梯度下降法时间复杂度是(KN²)，正规方程时间复杂度是O(N³)

当特征少于10000时，使用正规方程，否则使用梯度下降法

机器学习公开课笔记第二周，线性回归的梯度下降法

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习公开课笔记第二周，线性回归的梯度下降法 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

02-机器学习中的常用分类器

上一篇 2023年4月11日

机器学习实战—-Apriori算法进行关联分析

下一篇 2023年4月11日

PyTorch

pytorch torchversion标准化数据

新旧标准差的关系

2023年4月8日
000
PyTorch 训练前对数据加载、预处理深度学习框架PyTorch一书的学习-第五章-常用工具模块

参考：pytorch torchvision transform官方文档 Pytorch学习–编程实战：猫和狗二分类深度学习框架PyTorch一书的学习-第五章-常用工具模块 # coding:utf8 import os from PIL import Image from torch.utils import data import numpy as…

PyTorch 2023年4月6日
000
ng机器学习视频笔记（九） ——SVM理论基础

ng机器学习视频笔记（九） ——SVM理论基础（转载请附上本文链接——linhxx）一、概述支持向量机（support vector machine，SVM），是一种分类算法，也是属于监督学习的一种。其原理和logistics回归很像，也是通过拟合出一个边界函数，来区分各个分类的结果。二、代价函数与假设函数 …

机器学习 2023年4月10日
000
PyTorch

pytorch的topk()函数

pytorch.topk()用于返回Tensor中的前k个元素以及元素对应的索引值。例： import torch item=torch.IntTensor([1,2,4,7,3,2]) value,indices=torch.topk(item,3) print(“value:”,value) print(“indices:”,indices) 输出结果为…

2023年4月8日
000
人工智能的3大发展阶段和类别！

如果非要说出一项彻底改变 21 世纪的技术，那一定是人工智能。人工智能已逐渐成为我们日常生活的一部分，这也是为什么我们了解人工智能的不同概念很重要的原因。这篇关于人工智能类型的文章将帮助您了解人工智能的3个不同发展阶段和类别。本文将涵盖以下主题：什么是人工智能？人工智能的3大发展阶段人工智能的类型人工智能的技术领域什么是人工智能？ 1956 年，…

2022年11月29日 • 人工智能概论
000
100天搞定机器学习|Day60 遇事不决，XGBoost

XGBoost 是一种集大成的机器学习算法，可用于回归，分类和排序等各种问题，在机器学习大赛及工业领域被广泛应用。成功案例包括：网页文本分类、顾客行为预测、情感挖掘、广告点击率预测、恶意软件分类、物品分类、风险评估、大规模在线课程退学率预测。 XGBoost是初学者最值得深度理解的模型之一，它将决策树、boosting、GBDT 等知识点串联起来，强烈建议大…

机器学习 2023年4月13日
000
Caffe

未定义变量 “caffe” 或类 “caffe.reset_all”

配置caffe后在matlab中测试报错。未定义变量 “caffe” 或类 “caffe.reset_all”。我的原因是：caffe在matlab接口处没配置好。配置MatlabSupport 见caffe安装配置、matlab接口 – ostartech – 博客园 https://www.cnblogs.com/wxl845235800/p/…

2023年4月6日
000
GAN生成对抗网络

GAN对抗神经网络（原理解析）

一、总结一句话总结： (一)、GAN的主要灵感来源于博弈论中零和博弈的思想，应用到深度学习神经网络上来说，就是 (二)、**通过生成网络G（Generator）和判别网络D（Discriminator）不断博弈，进而使G学习到数据的分布**， (三)、如果用到图片生成上，则训练完成后，G可以从一段随机数中生成逼真的图像。 1、对抗神经网络中的生成器…

2023年4月5日
000

合作推广

合作推广

返回顶部