Coursera机器学习week2 笔记

2023年4月9日下午11:50 • 机器学习

Multiple Features

之前学的是“单变量线性回归”，明显一个问题不可能只有一个特征，现在增加特征数量变成“多变量线性回归”。

Coursera机器学习week2 笔记

下面对一些符号进行定义：

n：特征的数量

m：训练数据的数量

x⁽ⁱ⁾：训练集中的第i的数据

x⁽ⁱ⁾_j：第i个数据的第j个特征

y⁽ⁱ⁾：第i个数据的标签（输出结果）

y^⁽ⁱ⁾：第i个数据的预测结果

h(x)：预测模型

那和假设函数h_θ(x)=θ0+θ1x变成了h_θ(x)=θ₀+θ₁x₁+θ₂x₂+θ₃x₃+θ₄x₄....θ_nx_n

Coursera机器学习week2 笔记

令θ=(θ₀;θ₁;θ₂;θ₃;θ₄;θ₅;...θ_n), X=(x₀;x₁;x₂;x₃;x₄...x_n)，那么h_θ(x)=θ^TX

代价函数也和之前的类似

Coursera机器学习week2 笔记

梯度下降也类似

Coursera机器学习week2 笔记

由于 Coursera机器学习week2 笔记

所以J(θ)对 θj 的导数是 Coursera机器学习week2 笔记

Coursera机器学习week2 笔记

Feature Scaling（特征缩放）

在面对多维特征问题的时候，我们要确定这些特征具有相似的尺度，这样能帮助梯度更快地收敛。

以两个特征为例，一个尺度在0-2000，一个尺度在0-5，明显相差很大

Coursera机器学习week2 笔记

当用梯度下降法时，所需要跌打的数量明显很大，那么当两个特征都缩放到0-1时就很快了，跌打的

Coursera机器学习week2 笔记

普遍使用这种 Coursera机器学习week2 笔记

Learning rate（学习率）

Coursera机器学习week2 笔记

梯度下降算法收敛所需要的迭代次数根据模型的不同而不同，我们不能提前预知，我们可以绘制迭代次数和代价函数的图表来观测算法在何时趋于收敛。

Coursera机器学习week2 笔记

也有一些自动测试是否收敛的方法，例如将代价函数的变化值与某个阀值（例如 0.001）进行比较，但通常看上面这样的图表更好

梯度下降算法每次迭代受到α的影响

如果α过小，则达到收敛所需的跌打次数将很大；

如果α过大，每次迭代可能不会减小代价函数的值，反而会远离局部最小值导致无法收敛。

通常可以考虑的下面这些学习率

α = 0.01，0.03，0.1，0.3，1，3，10

Coursera机器学习week2 笔记

Features and polynomial regression（特征和多项式回归）

线性回归并不适用所有数据，有时候我们需要曲线来适应我们的数据，比如二次方模型或二次方模型

Coursera机器学习week2 笔记

我们可以令x₂ = x^₂₂ x₃ = x³₃从而将模型转化为线性回归模型

即h_θ(x) = θ₀+θ₁(size)+θ₂(size)²或者 Coursera机器学习week2 笔记

Coursera机器学习week2 笔记

Normal Equation（正规方程）

对于某些线性回归问题，正规方程方法是更好的解决方案，如：

Coursera机器学习week2 笔记

正规方程是通过求解下面的方程来找出使得代价函数最小的参数的：

Coursera机器学习week2 笔记

对于多项式也类似：

Coursera机器学习week2 笔记

当m = 4时

Coursera机器学习week2 笔记

梯度下降与正规方程的比较：

Coursera机器学习week2 笔记

只要特征变量的数目并不大，标准方程是一个很好的计算参数θ的代替方法。具体地说，只要特征变量数量小于一万，我通常使用标准方程法，而不使用梯度下降法。

随着我们要讲的学习算法越来越复杂，例如，当我们讲到分类算法，像逻辑回归算法，我们会看到，实际上对于那些算法，并不能使用标准方程法。对于那些更复杂的学习算法，我们将不得不仍然使用梯度下降法。因此，梯度下降法是一个非常有用的算法，可以用在有大量特征变量的线性回归问题。或者我们以后在课程中，会讲到的一些其他的算法，因为标算法都是值得学习的。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Coursera机器学习week2 笔记 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Coursera机器学习week4 笔记

上一篇 2023年4月9日下午11:49

机器学习中调参的基本思想是什么

下一篇 2023年4月9日下午11:50

机器学习笔记—– ID3算法的python实战

本文申明：本文原创，如有转载请申明。数据代码来自实验数据都是来自【美】Peter Harrington 写的《Machine Learning in Action》这本书，侵删。 Hello,又和大家见面了，今天心情出奇的好，不知道为什么。就是好。。。此处省略一万字。。。上一次和大家说了，决策树的理论部分，今天我们就来动手帮助眼科医生做一个系统，让这个系统学…

机器学习 2023年4月12日
000
建一个网站，用机器学习挑西瓜

在机器学习领域，有一个很有名气的西瓜–周志华老师的《机器学习》，很多同学选择这本书入门，都曾有被西瓜支配的恐惧。我写文章的时候也特别喜欢用西瓜数据集，以它为例手算+可视化讲解过XGBoost，自认非常通俗易懂。最近我介绍了决策树的可视化，还有可以快速实现机器学习web应用的神器——streamlit 今天我们就把它们结合起来，用机器学习帮华强挑西瓜！仅供…

机器学习 2023年4月12日
000
机器学习库《Spark 官方文档》机器学习库（MLlib）指南

spark-2.0.2 机器学习库（MLlib）指南 MLlib是Spark的机器学习（ML）库。旨在简化机器学习的工程实践工作，并方便扩展到更大规模。MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。 MLllib目前分为两个代码包： spark.mllib 包含基于RDD的原…

机器学习 2023年4月13日
000
机器学习-决策树的基本思想

机器学习-决策树的基本思想决策树算法是最早的机器学习算法之一。算法框架 1.决策树主函数各种决策树的主函数都大同小异，本质上是一个递归函数。该函数的主要功能是按照某种规则生长出决策树的各个分支节点，并根据终止条件结束算法。一般来讲，主函数需要完成如下几个功能。（1）输入需要分类的数据集和类别标签（2）根据某种分类规则得到最优的划分特征，并创建特征的…

机器学习 2023年4月13日
000
机器学习之GMM-EM

参考资料：机器学习课程的ppt…… Mixture Models 我们将研究混合模型，包括高斯混合模型和伯努利混合模型。关键思想是引入潜变量，它允许从更简单的分布形成复杂的分布。· 我们将看到，混合模型可以用具有离散的潜在变量（在有向的图形模型中）来解释。在后面的课堂上，我们还会看到连续的潜在变量。 K-Means Clustering k-群集分析…

机器学习 2023年4月11日
000
【机器学习】集成学习之sklearn中的xgboost基本用法

原创博文，转载请注明出处！本文代码的github地址博客索引地址 1.数据集数据集使用sklearn自带的手写数字识别数据集mnist，通过函数datasets导入。mnist共1797个样本，8*8个特征，标签为0~9十个数字。 1 ### 载入数据 2 from sklearn import datasets # 载入数据集 3 d…

机器学习 2023年4月12日
000
[机器学习]-分类问题常用评价指标、混淆矩阵及ROC曲线绘制方法

分类问题分类问题是人工智能领域中最常见的一类问题之一，掌握合适的评价指标，对模型进行恰当的评价，是至关重要的。同样地，分割问题是像素级别的分类，除了mAcc、mIoU之外，也可以采用分类问题的一些指标来评价。本文对分类问题的常见评价指标进行介绍，并附上利用sklearn库的python实现。将从以下三个方面分别介绍：常用评价指标混淆矩阵绘制及评价…

机器学习 2023年4月11日
000
机器学习

机器学习-KNN-ListedColormap绘制

1.了解KDTree：KDTree的思想、划分、实现 2.K近邻(KNN)：scikit-learn 中KNN相关的类库概述原理很简单：K近邻法(KNN)原理小结取数据集中最近的k个点，然后投票，k个点中标记的众数作为查询点的标记类型。绘制区域图： import numpy as np import matplotlib.pyplot as plt f…

2023年4月9日
000

合作推广

合作推广

返回顶部