机器学习

  • 经验之谈:如何为你的机器学习问题选择合适的算法

    随着机器学习越来越流行,也出现了越来越多能很好地处理任务的算法。但是,你不可能预先知道哪个算法对你的问题是最优的。如果你有足够的时间,你可以尝试所有的算法来找出最优的算法。本文介绍了如何依靠已有的方法(模型选择和超参数调节)去指导你更好地去选择算法。本文作者为华盛顿大学 eScience Institute 和 Institute for Neuroengi…

    机器学习 2023年4月13日
    00
  • 多标签分类 机器学习:多分类及多标签分类

    转自: 加载和生成多标签分类数据集  安装工具包 pip install arff pip install scikit-multilearn 加载多标签分类数据集   from skmultilearn.dataset import available_data_sets, load_dataset #data_set = set([x[0] for x …

    机器学习 2023年4月13日
    00
  • 机器学习的线性代数(Python 版)

    线性代数是数学的分支学科,涉及矢量、矩阵和线性变换。它是机器学习的重要基础,从描述算法操作的符号到代码中算法的实现,都属于该学科的研究范围。虽然线性代数是机器学习领域不可或缺的一部分,但二者的紧密关系往往无法解释,或只能用抽象概念(如向量空间或特定矩阵运算)解释。 这里我向大家推荐一个不错的线性代数学习教程,《Introduction to Linear A…

    机器学习 2023年4月13日
    00
  • 100天搞定机器学习|Day60 遇事不决,XGBoost

    XGBoost 是一种集大成的机器学习算法,可用于回归,分类和排序等各种问题,在机器学习大赛及工业领域被广泛应用。成功案例包括:网页文本分类、顾客行为预测、情感挖掘、广告点击率预测、恶意软件分类、物品分类、风险评估、大规模在线课程退学率预测。 XGBoost是初学者最值得深度理解的模型之一,它将决策树、boosting、GBDT 等知识点串联起来,强烈建议大…

    机器学习 2023年4月13日
    00
  • 机器学习1k近邻

    自己一直学习计算机视觉方面的东西,现在想学习一下数据挖掘跟搜索引擎,自己基础也有点薄弱,看朱明的那本数据挖掘,只能片面的了解这个数据挖掘。不过最近有一本书 机器学习实战,于是乎通过实战的形式了解一下基本的算法的执行过程。在算法当中,很多都是相通的,模式识别、机器学习、数据挖掘、自然语言处理等等这些算法归结起来其实差不了多少,题外话不多说了,好好学习。 k近邻…

    机器学习 2023年4月13日
    00
  • 100天搞定机器学习:模型训练好了,然后呢?

    100天搞定机器学习:模型训练好了,然后呢? 大家好,我是老胡。 许久没有更新100天搞定机器学习系列了,最近在看一个开源框架,其中有用到 gRPC ,它可以用于机器学习模型的部署,也可用于深度学习框架的开发,本文就当是《100天搞定机器学习》的番外篇吧。 gRPC(Remote Procedure Call) gRPC 由 Google 开发,是一款语言中…

    机器学习 2023年4月13日
    00
  • 机器学习7集成学习方法

    集成学习方法是机器学习领域中用来提升分类算法准确率的技术,主要包括Bagging和Boosting即装袋和提升。 我们这主要讲述Boosting中代表性算法AdaBoost元算法 基于数据集多重抽样的分类器 前面介绍了K近邻算法、决策树算法、朴素贝叶斯算法、逻辑回归以及支持向量机 这些算法各有优缺点,我们自然可以将不同的分类器组合起来,这种组合的结果就被称为…

    机器学习 2023年4月13日
    00
  • 机器学习3朴素贝叶斯

    朴素贝叶斯,基本思想就是,给出一个分类问题,对于待求项,属于哪个分类的概率最大,那这个待求项就属于哪个分类。 给出基本公式 假设要分类物有n个特征,分别为F1、F2、F3、…、Fn,现在有m个类别分别是C1、C2、C3、…、Cm.贝叶斯就是计算出概率最大的那个分类。 具体贝叶斯定理参考http://zh.wikipedia.org/wiki/%E8%B4%9…

    机器学习 2023年4月13日
    00
  • 机器学习2决策树

    决策树的思想比较简单,不复杂,决策树,就是通过一个属性将数据进行划分,而这个属性的选择也就是决策树的关键,用什么样的属性分开的值尽可能属于同一个类别。 属性选择的方法很多,书中主要介绍了:通过信息增益、增益比率、以及基尼指数. 具体伪代码书中给出: 本文采用了ID3算法划分数据集。该算法采用了一个叫信息增益的概念,关于信息论的部分,曾经写过一文http://…

    机器学习 2023年4月13日
    00
  • 机器学习8回归问题

    对于之前在分类问题中有逻辑回归,而对于这个线性回归以前一般是先讲述,将线性回归的结果通过函数映射到(0,1)区间,再以0.5作为区分形成分类问题。 具体的计算方法,在以前的blogs提到过,参考:http://www.cnblogs.com/fengbing/archive/2013/05/15/3079033.html 下面就直接实战 跟之前一样,第一步导…

    机器学习 2023年4月13日
    00
合作推广
合作推广
分享本页
返回顶部