机器学习

  • 《机器学习》(西瓜书)笔记(1)–绪论

    第一章    绪论 1.1 引言 机器学习致力于研究如何通过计算的手段,利用经验(计算机系统中通常以数据的形式存在)来改善系统自身的性能。 机器学习研究的主要内容是关于在计算机上从数据中产生模型的算法,即学习算法(learning algorithm)。     1.2 基本术语 数据集(data set) 示例(instance) / 样本(sample)…

    机器学习 2023年4月11日
    00
  • 《机器学习》(西瓜书)笔记(2)–模型评估与选择

    第二章    模型评估与选择 2.1  经验误差与过拟合 错误率(error rate):分类错误的样本数占样本总数的比例。 精度(accuracy):1 – 错误率误差(error):学习器的实际预测输出与样本的真实输出之间的差异称为误差。 训练误差(training error) / 经验误差(empirical error):学习器在训练集上的误差。 …

    机器学习 2023年4月11日
    00
  • 机器学习实践之决策树算法学习

    关于本文说明,本人原博客地址位于http://blog.csdn.net/qq_37608890,本文来自笔者于2017年12月06日 18:06:30所撰写内容(http://blog.csdn.net/qq_37608890/article/details/78731169)。     本文根据最近学习机器学习书籍 网络文章的情况,特将一些学习思路做了归…

    机器学习 2023年4月11日
    00
  • 《机器学习》西瓜书习题 第 4 章

    4.1   试证明对于不含冲突数据 (即特征向量完全相同但标记不同) 的训练集, 必存在与训练集一致 (即训练误差为 0)的决策树.   既然每个标记不同的数据特征向量都不同, 只要树的每一条 (从根解点到一个叶节点算一条) 枝干代表一种向量, 这个决策树就与训练集一致. 4.2   试析使用 “最小训练误差” 作为决策树划分选择准则的缺陷.   \(4.1…

    机器学习 2023年4月11日
    00
  • 《机器学习》西瓜书习题 第 3 章

    3.1   试析在什么情况下式 \((3.2)\) 中不必考虑偏置项 \(b\) .   书中有提到, 可以把 \(x\) 和 \(b\) 吸收入向量形式 \(\hat{w} = (w;b)\) .此时就不用单独考虑 \(b\) 了.  其实还有很多情况不用, 比如说使用了 \(\mathrm{one-hot}\) 编码, 就可以不用考虑偏置项.  更广泛的…

    机器学习 2023年4月11日
    00
  • 《机器学习》 西瓜书习题 第 2 章

    2.1   数据集包含 \(1000\) 个样本, 其中 \(500\) 个正例、\(500\) 个反例, 将其划分为包含 \(70\%\) 样本的训练集和 \(30\%\) 样本的测试集用于留出法评估, 试估算共有多少种划分方式.   如果划分要保证正例和反例一样多的话, 那么划分方式数量 \(n\) 有 \[\begin{aligned} n &…

    机器学习 2023年4月11日
    00
  • 机器学习(1)李宏毅

    一、什么是机器学习(Machine Learning) 通俗讲机器学习就是当你说一句话或输入一张图片,然后通过设计一个机器学习的程序,来让机器进行学习,进而可以识别更多的语音或识别更多的图片。 机器学习的过程可以理解为寻找一个相关Function()的过程。 二、Farmework框架 Training: 1、首先会有一系列的Function,如f1,f2,…

    机器学习 2023年4月11日
    00
  • ML03 利用Accord 进行机器学习的第一个小例子

    01 安装 Visual studio 2017.  不具备安装这个的话,也可安装,Microsoft Visual Studio Express (or equivalent)   02 创建 C# 的 控制台程序   03 添加 Accord 库    03  让机器学习『异或』的逻辑 不需要在代码里写出来异或的程序逻辑,告诉机器 异或的输入和输出(其实…

    机器学习 2023年4月11日
    00
  • 机器学习实战源码—–用线性回归找到最佳拟合曲线

    1 #_*_coding:utf-8_*_ 2 import numpy as np 3 import matplotlib.pyplot as plt 4 5 def loadDataSet(fileName): 6 #numFeat表示特征的数量 7 numFeat = len(open(fileName).readline().split(“\t”))…

    机器学习 2023年4月11日
    00
  • Python机器学习/LinearRegression(线性回归模型)(附源码)

      1.线性回归简介 线性回归定义:   百科中解释 我个人的理解就是:线性回归算法就是一个使用线性函数作为模型框架($y = w*x + b$)、并通过优化算法对训练数据进行训练、最终得出最优(全局最优解或局部最优)参数的过程。 y:我们需要预测的数值; w:模型的参数(即我们需要通过训练调整的的值) x:已知的特征值 b:模型的偏移量 我们的目的是通过已…

    机器学习 2023年4月11日
    00
合作推广
合作推广
分享本页
返回顶部