机器学习

  • 参数和非参数机器学习算法(转)

    【机器学习】参数和非参数机器学习算法 数据科学与人工智能 什么是参数机器学习算法并且它与非参数机器学习算法有什么不同? 本文中你将了解到参数和非参数机器学习算法的区别。 让我们开始吧。 学习函数 机器学习可以总结为学习一个函数(f)(f),其将输入变量(X)(X)映射为输出变量(Y)(Y)。 Y=f(x)Y=f(x) 算法从训练数据中学习这个映射函数。 函数…

    机器学习 2023年4月12日
    00
  • 机器学习模型为什么要将特征离散化(转)

    我在刷Kaggle时发现一个问题。很多人在处理数据的时候,经常把连续性特征离散化。对此我感到很好奇,所以上网搜了一些总结,主要内容来自知乎连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果? 这个是严林的回答在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点…

    机器学习 2023年4月12日
    00
  • 机器学习实战读书笔记(四)基于概率论的分类方法:朴素贝叶斯

    4.1 基于贝叶斯决策理论的分类方法   朴素贝叶斯   优点:在数据较少的情况下仍然有效,可以处理多类别问题   缺点:对于输入数据的准备方式较为敏感   适用数据类型:标称型数据   贝叶斯决策理论的核心思想:选择具有最高概率的决策。 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类   朴素贝叶斯的一般过程:   1.收…

    机器学习 2023年4月12日
    00
  • 机器学习实战读书笔记(二)k-近邻算法

    knn算法: 1.优点:精度高、对异常值不敏感、无数据输入假定 2.缺点:计算复杂度高、空间复杂度高。 3.适用数据范围:数值型和标称型。 一般流程: 1.收集数据 2.准备数据 3.分析数据 4.训练算法:不适用 5.测试算法:计算正确率 6.使用算法:需要输入样本和结构化的输出结果,然后运行k-近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类…

    机器学习 2023年4月12日
    00
  • 机器学习实战读书笔记(三)决策树

    3.1 决策树的构造 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据. 缺点:可能会产生过度匹配问题. 适用数据类型:数值型和标称型.   一般流程: 1.收集数据 2.准备数据 3.分析数据 4.训练算法 5.测试算法 6.使用算法   3.1.1 信息增益 创建数据集 def createDataSet(): dat…

    机器学习 2023年4月12日
    00
  • 机器学习实战读书笔记(五)Logistic回归

    Logistic回归的一般过程 1.收集数据:采用任意方法收集 2.准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳 3.分析数据:采用任意方法对数据进行分析 4.训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数 5.测试算法:一旦训练步骤完成,分类将会很快。 6.使用算法:首 先,我们需要输入一些数…

    机器学习 2023年4月12日
    00
  • 机器学习实战读书笔记(一)机器学习基础

    http://sourceforge.net/projects/numpy/files/ 下载对应版本的numpy,到处下不到,找到一个没python2.7 用pip吧, pip install numpy 下载完毕,提示没装C++,意思是还要装VS2008,但装的是VS2012,只好去下载一个VC for python http://www.microso…

    机器学习 2023年4月12日
    00
  • MLPerf 机器学习基准测试实战入门(一)NAVIDA-GNMT

    将MLPerf训练结果库拷到本地 使用的是training_results_v0.6,而不是mlperf / training存储库中提供的参考实现。请注意,这些实现有效地用作基准实现的起点,但尚未完全优化,并且不打算用于软件框架或硬件的“实际”性能评估。 git clone https://github.com/Caiyishuai/training_re…

    机器学习 2023年4月12日
    00
  • 【机器学习】李宏毅——Flow-based Generative Models

    本文主要介绍了Flow-based Generative Models的概念,以及其内部各个模块的主要思想,可结合我之前写过的生成模型的博客共同阅读。 前文我介绍了部分关于生成学习的内容,可以参考我这篇博文点此前面介绍的各个生成模型,都存在一定的问题: 对于PixelRNN这类模型来说,就是从左上角的像素开始一个个地进行生成,那么这个生成顺序是否合理,每一个…

    机器学习 2023年4月12日
    00
  • 让机器教人学习更有效:Becoming the Expert – Interactive Multi-Class Machine Teaching

      这是CVPR2015的一篇非常有趣的文章,论文研究了如何让机器自动地教导学生进行学习目标的分类。论文研发了一种机器学习方法,通过人机交互的过程中,不断的优化机器指导的方法和技巧,从而提高人学习目标分类的效率。如下图所示:                                   机器教导人学习的过程   1、机器首先展示一张图片A给人看,不告诉…

    机器学习 2023年4月11日
    00
合作推广
合作推广
分享本页
返回顶部