机器学习-学习笔记(一)–>(假设空间&版本空间)及归纳…

机器学习-学习笔记(一)-->(假设空间&版本空间)及归纳学习算法

引言

机器学习是人工智能和数据科学领域的热点话题。本篇文章旨在介绍机器学习中的重要概念——假设空间和版本空间,以及一个常用的归纳学习算法——Find-S 算法。

假设空间和版本空间

假设空间是指机器学习模型能够表示的所有可能假设的集合。在监督学习中,每个假设由一个函数表示,即假设空间是函数集合。例如对于二分类问题,假设空间可以是所有二元分类函数的集合。而版本空间则是指与经验数据(即训练数据)一致的假设集合,版本空间是假设空间的子集,版本空间由训练数据和假设空间决定。

例如有以下训练数据集:

X1 X2 X3 Y
1 0 1 0
0 1 0 1
1 1 1 0

这是一个二分类训练数据集,我们假设空间为三元布尔函数集合,并设定初始版本空间为所有假设的集合,即

$$ \mathcal{H} = {h_1, h_2, h_3, h_4, h_5, h_6, h_7, h_8} $$

那么,版本空间就表示能够经过二分类训练数据的所有假设组成的假设集合,可通过Find-S算法求解得到。

Find-S算法

Find-S算法是一种简单的归纳学习算法。它的思想是,从假设空间中选取一个能够与训练数据匹配的最特殊假设,不断通过样例进行迭代地缩小版本空间,最终得到符合实际情况的假设。

具体地,Find-S算法的步骤如下:

  1. 初始化版本空间 $\mathcal{V}$ 为假设空间 $\mathcal{H}$ 中的所有假设。
  2. 对于训练集中的每一个正实例,移除 $\mathcal{V}$ 中不包含该实例的假设。
  3. 对于训练集中的每一个负实例,移除 $\mathcal{V}$ 中包含该实例的假设。
  4. 返回最特殊的假设 $h_S$。

在举例说明 Find-S 算法之前,需要先定义一个重要的概念——"比较特殊"。在本文中,“比较特殊”的假设是指与训练集中某些正实例有所区别,而这些正实例与负实例没有区别。反过来,“比较泛化”的假设是指在训练数据集中,不能与任何正实例或负实例区别。

接下来,我们以三个特定的训练数据来说明 Find-S 算法。

X1 X2 X3 Y
1 0 1 0
0 1 0 1
1 1 1 0
  1. 初始化: $\mathcal{H} = {h_1, h_2, h_3, h_4, h_5, h_6, h_7, h_8}$, $\mathcal{V} = \mathcal{H}$。
  2. 对于第一个训练样例 $(1, 0, 1, 0)$,$\mathcal{V}$ 变为 ${h_3, h_5}$,即去掉所有在这个样本上的表现不好的假设。因为 $h_1, h_2, h_4, h_6, h_7, h_8$ 都不符合样本 (1, 0, 1, 0)。其中,$h_3$ 表示 $X_1 = 1$ 且 $X_3 = 1$ 的假设,$h_5$ 表示 $X_3 = 1$ 的假设。
  3. 对于第二个样例 $(0, 1, 0, 1)$,$\mathcal{V}$ 变为 ${h_3}$,即保留所有在前两个样本上表现比较好的假设。这是因为只有 $h_3$ 符合第二个样本。$h_3$ 表示 $X_1 = 1$ 且 $X_3 = 1$。
  4. 对于第三个样例 $(1, 1, 1, 0)$,$\mathcal{V}$ 又变为 ${h_3}$,即保留所有在一个好的样本上表现比较好的假设。这是因为只有 $h_3$ 符合第三个样本。
  5. 返回 $h_S = h_3$,即 $X_1 = 1$ 且 $X_3 = 1$。

通过以上例子,我们看到Find-S 算法能够在有限步内找到最特殊且与训练数据集一致的假设。但需要注意的是,该算法在面对一些复杂的情况时可能会陷入局部最优解。

结论

本文介绍了机器学习中的假设空间和版本空间,以及常用于监督学习的一个简单归纳算法——Find-S算法。这里并未详细讲解其他分类算法,但这些基本概念对机器学习领域的学习和实践都是至关重要的。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:机器学习-学习笔记(一)–>(假设空间&版本空间)及归纳… - Python技术站

(0)
上一篇 2023年3月28日
下一篇 2023年3月28日

相关文章

  • PHP static局部静态变量和全局静态变量总结

    PHP static局部静态变量和全局静态变量总结 在PHP中,我们可以使用static关键字来声明静态变量。静态变量可以在函数内部或类的方法内部使用,并且在多次调用时保持其值不变。在本文中,我们将讨论PHP中的局部静态变量和全局静态变量,并提供一些示例说明。 局部静态变量 局部静态变量是在函数内部声明的静态变量。它们只能在声明它们的函数内部访问,并且在函数…

    other 2023年7月28日
    00
  • MySQL表的创建及字段介绍(小白入门篇)

    MySQL表的创建及字段介绍(小白入门篇) MySQL是一个广泛使用的关系型数据库管理系统,学习如何创建表及字段是MySQL的基础部分。在本文中,我们将介绍MySQL表的创建及字段的基本概念。 创建MySQL表的步骤 创建MySQL表的过程通常包括以下几个步骤: 选择一个合适的数据库来创建表。 设计表的结构:定义表的列,设置每一列的属性。 创建表:使用CRE…

    other 2023年6月25日
    00
  • 暗黑3登陆发生错误code18012解决方法

    下面我将为大家详细讲解”暗黑3登陆发生错误code18012解决方法”的完整攻略。 问题描述 在使用暗黑3游戏时,有时会出现“登陆发生错误,code18012”的提示,导致玩家无法正常进入游戏进行游戏体验。 解决方法 出现该问题的原因可能是因为暗黑3游戏客户端在与服务器进行通信时出现了错误,可能是因为网络不稳定、防火墙或杀毒软件的拦截等原因。因此,解决该问题…

    other 2023年6月27日
    00
  • 微信小程序 swiper 组件遇到的问题及解决方法

    下面是“微信小程序 swiper 组件遇到的问题及解决方法”的完整攻略。 问题描述 在使用微信小程序的 swiper 组件时,可能会遇到以下问题: swiper 滑动不流畅,卡顿。 swiper 组件只能左右滑动,无法上下滑动。 swiper 组件嵌套过多时,会有渲染性能问题。 接下来,我们将分别介绍这些问题的原因和解决方法。 swiper 滑动不流畅的问题…

    other 2023年6月27日
    00
  • webdriver简介及浏览器的驱动

    以下是“WebDriver简介及浏览器驱动的完整攻略”的标准markdown格式文本,其中包含了两个示例: WebDriver简介及浏览器驱动的完整攻略 WebDriver是一种用于自动化测试的工具,可以模拟用户在浏览器中的操作,例如点击、输入、提交等。以下是WebDriver的简介及浏览器驱动的完整攻略。 1. WebDriver简介 WebDriver是…

    other 2023年5月10日
    00
  • gho是什么文件格式?.gho文件怎么打开?

    GHO文件格式是什么? GHO文件格式是由Symantec Ghost软件创建的一种磁盘映像文件格式。它是一种备份和还原磁盘的文件格式,常用于系统克隆、恢复和部署。GHO文件包含了整个磁盘的扇区数据,包括操作系统、应用程序、文件和文件系统的结构。 如何打开GHO文件? 要打开GHO文件,您需要使用Symantec Ghost软件或其他兼容的磁盘映像软件。以下…

    other 2023年8月6日
    00
  • 【python】shellmd5使用的那些事

    【Python】shellmd5使用的那些事 shellmd5是一个Python库,用于计算文件的MD5值。它可以在命令行中使用,也可以在Python脚本中使用。本文将提供一个完整攻略,包括安装、使用方法、示例说明等。 1. 安装 使用pip命令可以轻松安装shellmd5库。在命令行中输入以下命令即可: pip install shellmd5 2. 使用…

    other 2023年5月8日
    00
  • 检查上传图片是否合法的函数,木马改后缀名、图片加恶意代码均逃不过

    检查上传图片是否合法的函数攻略 为了确保上传的图片是合法的,我们可以采取以下步骤: 验证文件类型:首先,我们需要验证上传的文件是否是图片文件。我们可以通过检查文件的扩展名或者使用文件的魔术数字(magic number)来确定文件类型。常见的图片文件类型有JPEG、PNG、GIF等。以下是一个示例函数,用于验证文件类型: import imghdr def …

    other 2023年8月5日
    00
合作推广
合作推广
分享本页
返回顶部