机器学习

  • 数据分析训练-Pima印第安人数据集上的机器学习-分类算法(根据诊断措施预测糖尿病的发病)

    本文主要内容摘自 易悠 博主的 Pima印第安人数据集上的机器学习-分类算法(根据诊断措施预测糖尿病的发病)https://blog.csdn.net/yizheyouye/article/details/79791473在一些地方做了补充说明,便于小白理解。 数据集简介 该数据集最初来自国家糖尿病/消化/肾脏疾病研究所。 数据集的目标是基于数据集中包含的某…

    2023年4月10日
    00
  • 机器学习:ID3算法

    1  简介   决策树学习是一种逼近离散值目标函数的方法,在这种学习到的函数被表示为一棵决策树。 2 决策树表示   决策树通过把实例从根节点排列到某个叶子结点来分类实例,叶子结点即为实例所属的分类。树上的每一个结点指定了对实例的某个属性的测试,并且该结点的每一个后续分支对应于该属性的一个可能值。 分类实例的方法是从这棵树的根节点开始,测试这个结点指定的属性…

    2023年4月10日
    00
  • 《图解机器学习-杉山将著》读书笔记—CH4

    CH4 带有约束条件的最小二乘法 重点提炼 提出带有约束条件的最小二乘学习法的缘故:   左图中可见:一般的最小二乘学习法有个缺点—-对于包含噪声的学习过程经常会过拟合 右图:有了空间约束之后,学习到的曲线能避免过拟合,得到想要的学习结果(x-y关系)。   带有约束条件的最小二乘学习法具体方法 1.部分空间约束的最小二乘学习法 ① 公式   在上面普通…

    2023年4月10日
    00
  • 机器学习工程师 – Udacity 项目:实现一个狗品种识别算法App

    步骤 0: 导入数据集 导入狗数据集 在下方的代码单元(cell)中,我们导入了一个狗图像的数据集。我们使用 scikit-learn 库中的 load_files 函数来获取一些变量: train_files, valid_files, test_files – 包含图像的文件路径的numpy数组 train_targets, valid_targets,…

    2023年4月10日
    00
  • 机器学习案例一:小样本数据建模与灰色系统理论

      现在在机器学习领域的主流思维都是使用大量或海量的数据来训练一个模型从而得到很好的分类或回归结果。但是,在某些科学或应用场合,由于数据采集的不变性,导致在很长的时间内只获取了极少数量的数据,或者是在本来是具有海量数据的环境下,由于数据的质量不佳、冗余以及数据的不可靠,导致海量的数据只有极少数的数据样本可以使用。在以上的情况下,使用现在主流的深度学习模型是不…

    2023年4月10日
    00
  • 机器学习案例二:缺失时间序列数据填补与ESN(回声状态网络)

      时间序列数据是一种与时间因素有关系的连续的数据,通常使用传感器等来获取,具有极高的应用价值,可以实时记录被监测设备或人的状态,同时可以用于预测建模,得到对某事件未来发展的一个期望。 在使用传感器进行数据采集的过程中,在没有备用传感器的情况下,会由于种种原因出现采集到的数据在某个时间段内数据缺失的现象。针对某个时间段内的部分数据缺失需要进行科学的验证,最重…

    机器学习 2023年4月10日
    00
  • 机器学习 简历

    1. 3.项目经验及能力 1.基于GradientBoosting模型的厦门市房价预测系统,20000多条样本,回归得分0.95(毕业设计项目)通过项目实践收获的能力:数据分析、特征工程、模型调参;Python机器学习库scikit-learn中随机森林、GBDT、xgboost等集成算法的使用博客链接:https://www.jianshu.com/c/8…

    机器学习 2023年4月10日
    00
  • 机器学习 试题

    1. 图像算法 site:www.wjx.cn  https://blog.csdn.net/qq_41004007   2. https://blog.csdn.net/u012794724/article/details/83052259 3.      简述你熟悉的聚类算法并说明其优缺点 3. 请描述以下任一概念:SIFT/SURF LDA/PCA  …

    机器学习 2023年4月10日
    00
  • [转]机器学习——C4.5 决策树算法学习

    1. 算法背景介绍 分类树(决策树)是一种十分常用的分类方法。它是一种监管学习,所谓监管学习说白了很简单,就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。C4.5分类树就是决策树算法中最流行的一种。下面给出一个数据集作为算法例子的…

    2023年4月10日
    00
  • 机器学习概念区分(一)性能度量 vs 损失函数

    (1)表示: 将样本空间映射到一个合适的特征空间,一般地,我们更青睐于这样的表示是低维度的,是更加稀疏交互的,同时也希望是相互独立的。【从大量特征挑出好的特征,降维】 让机器来学习怎样表示,就是表示学习。 (2)评估: 模型在数据上表现的量化形式,我们选取合适的函数来表示什么样子的模型是好的,性能度量就是评估。【用来评价模型好坏的函数】 (3)优化: 前两步…

    2023年4月10日
    00
合作推广
合作推广
分享本页
返回顶部