这些是最热门的机器学习技术!

在上文中我们已经了解了机器学习的原理,就是模仿人类大脑进行学习的过程,通过让机器模仿这种学习过程实现所谓的“智能”。

经过近几十年的发展,机器学习的方法也越来越成熟,主要有以下几种:

  • 监督学习
  • 无监督学习
  • 强化学习
  • 深度学习
  • 深度强化学习

机器学习方法

如上图所示,机器学习是从左往右的发展方向,每一阶段的学习方法都比上一代优秀了很多。
下面简单介绍这几种机器学习方法的工作原理。

监督学习

监督学习指的是让机器从现有的标注好的已知数据中学习预测模型的学习方法。

简单来说,先给定计算机一组标记好的数据,让计算机用回归或分类的方法计算出数据与标记之间的经验关系。

通过这种方式,计算机最终会得出一个预测模型,训练数据越多,预测模型越准确。

而所谓的“回归”和“分类”方法,是计算机的两种寻找规律的方式。具体如下:

回归方法
计算机通过给定的标记与数据之间的特征值,计算出标记与数据之间的经验关系。

这种方法最终得到的预测模型其实就是“经验关系”。当训练完成,你可以使用模型对未知数据进行预测,以此来测试计算机是否已经学习到了。

分类方法
分类方法指的是让计算机将性质相似的数据分类为一个组。这种方法得到的模型是一个分类器。
训练完成后,你可以使用未知数据让分类器进行分类,根据分类结果判断计算机的预测精度水平。
监督学习的方法包括:KNN、SVN等。

无监督学习

无监督学习是相对于监督学习来讲的,是对监督学习的升级版。

无监督学习指的是从无标注的数据集中学习预测模型的方法。

监督学习需要给计算机标记好的训练集,而无监督学习不需要人工标记训练集,计算机会根据现有的数据集的特征,自动对数据集进行分类。

无监督学习的方法有:聚类、K均值、PCA等

强化学习

强化学习与监督学习、无监督学习最大的区别,就是它不是一个分类任务。

强化学习训练时,需要环境给予反馈,以及对应具体的反馈值。通过反馈值告诉预测模型预测结果是“好”还是“坏”,然后通过外界的反馈结果调整预测模型。

深度学习

深度学习是无监督学习的一种,它模仿的是人类大脑神经网络。

常用的深度学习方法有深度神经网络、深度信念网络、递归神经网络和卷积神经网络等。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

深度强化学习

深度学习具有较强的感知能力,但是缺乏一定的决策能力;而强化学习具有决策能力,对感知问题束手无策。因此,深度强化学习将深度学习和强化学习相结合,优势互补,为复杂系统的感知决策问题提供了解决思路。

该技术在机器人、视频游戏、金融和医疗领域取得了巨大成功。许多以前无法解决的问题现在通过创建DRL模型得到了解决。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:这些是最热门的机器学习技术! - Python技术站

(0)
上一篇 2023年4月11日
下一篇 2022年11月12日

相关文章

  • 机器学习笔记(1): 模型和 cost function

    表达模型 变量表示: x(i) : 第 i 个输入变量,也称为输入特征 y(i) : 第 i 个输入变量,即我们希望预测的内容 (x(i), y(i)) ; i = 1,…,m : 表示一个训练集 X : 输入值空间; Y : 输出值空间   模型的表达: 对于监督学习来说,就是给定一个训练集,输出一个函数 h:X –> Y,使函数 h(x) 能…

    机器学习 2023年4月13日
    00
  • 知识图谱实体对齐1:基于平移(translation)的方法

    在知识图谱领域,最重要的任务之一就是实体对齐 (entity alignment, EA)。实体对齐旨在从不同的知识图谱中识别出表示同一个现实对象的实体。由于embedding模块独立地学习知识图谱的emebddings,这使得多个知识图谱的embeddings落入到不同的向量空间中。而alignment模块旨在将两个知识图谱的embeddings统一(un…

    机器学习 2023年4月11日
    00
  • 机器学习训练模型的一般错误

    在我们构建完机器学习模型,经常会遇到训练得到模型无法正确预测,这之后我们往往会采取下面的一些方案: 增加训练数据 减少特征的个数 增加更多的特征 增加多项式特征(X1*X2 …) 增大lambda的值 减小lambda的值 若是不了解模型具体的问题所在,而根据随便拿出一个方案去试错,这往往都是既费力又费心,往往个把月过去了仍然在进行模型的调试。 CV 数…

    机器学习 2023年4月11日
    00
  • python机器学习-数据集划分

    机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 划分比例: 训练集:70% 80% 75% 测试集:30% 20% 30% 数据集划分api sklearn.model_selection.train_test_split(arrays, *options) x 数据集的特征值 y 数据…

    机器学习 2023年4月9日
    00
  • Python机器学习/LinearRegression(线性回归模型)(附源码)

      1.线性回归简介 线性回归定义:   百科中解释 我个人的理解就是:线性回归算法就是一个使用线性函数作为模型框架($y = w*x + b$)、并通过优化算法对训练数据进行训练、最终得出最优(全局最优解或局部最优)参数的过程。 y:我们需要预测的数值; w:模型的参数(即我们需要通过训练调整的的值) x:已知的特征值 b:模型的偏移量 我们的目的是通过已…

    机器学习 2023年4月11日
    00
  • 【模式识别与机器学习】——3.6感知器算法3.7采用感知器算法的多类模式的分类

      出发点   一旦判别函数的形式确定下来,不管它是线性的还是非线性的,剩下的问题就是如何确定它的系数。   在模式识别中,系数确定的一个主要方法就是通过对已知样本的训练和学习来得到。   感知器算法就是通过训练样本模式的迭代和学习,产生线性(或广义线性)可分的模式判别函数。 基本思想   采用感知器算法(Perception Approach)能通过对训练…

    机器学习 2023年4月13日
    00
  • 机器学习实战笔记-树回归

    9.1 复杂数据的局部性建模 第3章使用决策树来进行分类。决策树不断将数据切分成小数据集,直到所有目标变量完全相 同 ,或者数据不能再切分为止。决策树是一种贪心算法,它要在给定时间内做出最佳选择,但并不关心能否达到全局最优。 树回归 优点:可以对复杂和非线性的数据建模。 缺点:结果不易理解。 适用数据类型:数值型和标称型数据。 第3章使用的树构建算法是ID3…

    机器学习 2023年4月10日
    00
  • 【Python】Pandas读取 excel 机器学习之数据预处理,Pandas读取excel数据

    CSV和EXCEL: excel文件和 csv 文件的区别在于前者有分页(sheet),而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 “,” 结尾,而 csv 是以制表 “\t” 结尾。注意一点的是,并不是所有得到文件其内容都很规范,比如在一个单元格里面有一大段句子含有英文逗号,就会导致生成 DataFrame 出现问题。所以在导…

    机器学习 2023年4月13日
    00
合作推广
合作推广
分享本页
返回顶部