Coursera机器学习week4 笔记

2023年4月9日下午11:49 • 机器学习

Non-linear hypotheses

我们之前学到的，无论是线性回归还是逻辑回归都有一个缺点，当特征太多时，计算负荷会非常的大。

如下：

Coursera机器学习week4 笔记

只有x1和x2，但运用多次项进行预测时，我们的方程可以很好的预测。使用非线性的多项式能够帮助我们建立更好的分类模型。

例如我们有很多的特征，100个变量，用这100个特征构建一个非线性的多项式模型，结果将是非常大的特征组合，即使我们只才有两两特征的组合(x₁x₂+x₁x₃+x₁x₄+...+x₂x₃+x₂x₄+...x₉₉x₁₀₀),也会有解决5000个组合而成的特征，对于一般的逻辑回归特征是太多了。

例如：

Coursera机器学习week4 笔记

一张图片，即使是50*50的图片，也有解决2500个特征，如果进行两两特征组合构成一个多项式模型，就约有2500²/2的特征组合(接近3百万个)，在大一点的图片特征就更多了，计算负荷会非常的大。

Coursera机器学习week4 笔记

Neurons and the brain

Coursera机器学习week4 笔记

神经网络兴起于二十世纪八九十年代，应用得非常广泛，但由于各种原因，在90年代的后期应用逐渐减少。最近，神经网络又东山再起了。

其中一个原因是神经网络是计算量偏大的算法，而现在计算机的运行速度变快很多，才足以真正运行起大规模的神经网络。

例如我们的听觉和视觉：

Coursera机器学习week4 笔记

还有各种各样的例子：

Coursera机器学习week4 笔记

Model representation I

Coursera机器学习week4 笔记

在人的大脑中，每一个神经元都可以被认为是一个处理单元/神经核(processing unit/ Nucleus)，它含有许多输入/树突(input/Dendrite)，并且有一个输出/轴突(output/Axon)

神经网络是大量神经元相互连接并通过电脉来交流的一个网络。

神经网络模型建立在很多神经元之上，每一个神经元又是一个个学习模型。这些神经元（也叫激活单元，activation unit）采纳一些特征作为输出，并且根据本身的模型提供一个输
出。下图是一个以逻辑回归模型作为自身学习模型的神经元示例，在神经网络中，参数又可被成为权重（weight）。

神经网络也可以有隐藏层：

Coursera机器学习week4 笔记

其中x₁,x₂,x₃是输入单元，我们把原始数据输入给它们，a₁,a₂,a₃是中间单元，它们负责将数据进行处理，然后呈递到下一层。最后是输出单元，它负责计算h(x).

符号定义：

Coursera机器学习week4 笔记

每一层的输出变量都是下一层的输入变量，第一层为输入层，最后一层为输出层，中间的为隐藏层，每一层都有一个偏差单元。

Coursera机器学习week4 笔记

这样通过计算最终就可以得到h_θ(x)的值。一般情况下每一层都要多加入一个变量。

我们把这样从左往右的算法称为前向传播算法(FORWARD PROPAGATION)

Model representation II

利用向量化的方法会使得计算更为简便。以上面的神经网络为例，计算第二层的值：

Coursera机器学习week4 笔记

Coursera机器学习week4 笔记

我们令z⁽²⁾ = θ⁽¹⁾x，则a⁽²⁾ = g(z⁽²⁾)，计算后添加a⁽²⁾₀ = 1。

同样令z⁽²⁾ =θ⁽¹⁾a⁽²⁾ ，则hθ(x) = a⁽³⁾ = g(z⁽³⁾)。

Coursera机器学习week4 笔记

多层的也类似：

Coursera机器学习week4 笔记

由上一层输出值当作下一层输入值进行计算得到输出值给下一层。

Examples and intuitions I

以XOR(异或)为例：

Coursera机器学习week4 笔记

当x¹ = x² 时 y = 1 ，或者 y = 0

Coursera机器学习week4 笔记

上面是“与”(AND)运算，输入层由两个变量x¹和x²组成，再加上一个1，权重分别是-30,20,20。

那么h_θ(x) = a¹ = g(z⁽¹⁾) = g(-30+20x₁+20x₂)，将x₁,x₂的值代入进去，得到的值正好和“与”运算相符

Coursera机器学习week4 笔记

再比如“或”(OR)运算，权重可以设为-10，20，20这三个，得出的结果会和“或”运算相符。

Examples and intuitions II

之前介绍了“或”和“与”，下面介绍下“非”运算，这个更简单些，只需要一个变量。

Coursera机器学习week4 笔记

有了“或”、“与”和“非”，现在就可以计算“同或门”运算了。

由于x₁XNOR x₂= (x₁ and x₂ ) or ((not x₁) and (not x₂))

所以我们可以先计算，(not x₁) and (not x₂) 为 a₂. 然后在计算a₁ or a₂ 得到答案

过程如下：

Multiclass Classification

有时候我们有不止两种分类，也就是y = 2, 3, 4, 5..... 那么这种情况怎么办呢？

如果我们要训练一个神经网络算法来识别路人、汽车、摩托车和卡车，在输出层我们应该有 4 个值。

例如，第一个值为 1 或 0 用于预测是否是行人，第二个值用于判断是否为汽车。
那么[1; 0; 0; 0]可以表示路人，[0; 1; 0; 0] 可以表示汽车等等。

Coursera机器学习week4 笔记

输入情况就有四种了：

Coursera机器学习week4 笔记

Coursera机器学习week4 笔记

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Coursera机器学习week4 笔记 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Coursera机器学习week1 笔记

上一篇 2023年4月9日下午11:48

Coursera机器学习week2 笔记

下一篇 2023年4月9日下午11:50

机器学习概念之特征选择（Feature selection）之RFormula算法介绍 Spark MLlib编程API入门系列之特征选择之R模型公式（RFormula）

　　不多说，直接上干货！ RFormula算法介绍： RFormula通过R模型公式来选择列。支持R操作中的部分操作，包括‘~’, ‘.’, ‘:’, ‘+’以及‘-‘，基本操作如下： 1、 ~分隔目标和对象 2、+合并对象，“+ 0”意味着删除空格 3、 :交互（数值相乘，类别二值化） 4、. 除了目标外的全部列 …

机器学习 2023年4月12日
000
Machine Learning:机器学习算法

原文链接：https://riboseyim.github.io/2018/02/10/Machine-Learning-Algorithms/ 机器学习算法分类：监督学习、半监督学习、无监督学习、强化学习基本的机器学习算法：线性回归、支持向量机(SVM)、最近邻居(KNN)、逻辑回归、决策树、k平均、随机森林、朴素贝叶斯、降维、梯度增强目录监督学习(…

机器学习 2023年4月13日
000
搞机器学习需要数学基础吗？

人工智能的浪潮已席卷全球，“人工智能（AI）”、“机器学习”、“深度学习”等词汇经常出现在我们的视线中，同时绝大部分人也往往搞不清这些看起来很高大上的词汇之前有何异同。概括来说，“机器学习”是目前实现“人工智能”最主流的一种方法；机器学习中有一种叫“神经网络（学习）”的算法，当神经网络层数≥8层时，便可称为“深度学习”。也就是说，要想进军人工智能，机器学…

机器学习 2023年4月13日
000
【机器学习】：特征筛选方法

一.基于统计值的筛选方法 1.过滤法：选择特征的时候，不管模型如何，首先统计计算该特征和和label的一个相关性，自相关性，发散性等等统计指标。优点：特征选择开销小，有效避免过拟合缺点：没有考虑后续的学习器来选择特征，减弱了学习器的学习能力（因为某些特征可能和label算出来相关性不大，但是可能和其他特征交叉后，会和label具有很强的关联性） 2.单变…

机器学习 2023年4月12日
000
一脸懵逼学习Hadoop分布式集群HA模式部署（七台机器跑集群）

1）集群规划：主机名　　 IP 安装的软件　　运行的进程master 192.168.199.130 jdk、hadoop 　　NameNode、DFSZKFailoverController(zkfc)slaver1 192.168.199…

机器学习 2023年4月15日
000
One-Hot编码(转) 机器学习：数据预处理之独热编码（One-Hot）

前言 ———————————————————————————————————————— 在机器学习算法中，我们经常会遇到分类特征，例如：人的性别有男女，祖国有中国，美国，法国等。这些特征值并不是连续的，而是离散的，无序的。通常我们需要对其进行特征数字化。那什么是特征数字化呢？例子如下：性别特征：[“男”，”女”] 祖国特征：[“中国”，”美国，”法国”]…

机器学习 2023年4月10日
000
机器学习模型ML

“其实我是做机器学习模型的。” “什么模型？拿出来给大家看看啊！” 如果你是一个机器学习（ML）程序员，向爸妈、亲友或者客户介绍自己的职业时，可能会遇到这样的尴尬。现在有了斯坦福大学出品的 Gradio ，你真的可以把自己的ML模型“搬”出来了。只需几行代码，你就可以创建一个简单的网页，即使完全不会代码的爸妈，也能用拖拽操作体验你的ML模型。除此之外，…

机器学习 2023年4月13日
000
过去5年最受欢迎机器学习论文+代码速查

… 过去5年最受欢迎机器学习论文+代码速查新智元编译来源：paperswithcode.com 编辑：肖琴【新智元导读】Papers with Code网站将ArXiv上的最新机器学习论文与GitHub上的代码联系起来。这个项目索引了大约5万篇论文和1万个GitHub库，你可以按标题关键词查询，也可以按流行程度、GitHub星星数排列“热门研究”，…

机器学习 2023年4月13日
000

合作推广

合作推广

返回顶部