机器学习
-
菜鸟之路——机器学习之HierarchicalClustering层次分析及个人理解
这个算法。我个人感觉有点鸡肋。最终的表达也不是特别清楚。 原理很简单,从所有的样本中选取Euclidean distance最近的两个样本,归为一类,取其平均值组成一个新样本,总样本数少1;不断的重复,最终样本数为1。这样的话就形成了一个树,每个节点要不有两个子节点,要不没有子节点。 这个算法也大概能分出来类,但是实用性我觉得不是很强。 源代码 1 fr…
-
菜鸟之路——机器学习之Kmeans聚类个人理解及Python实现
一些概念 相关系数:衡量两组数据相关性 决定系数:(R2值)大概意思就是这个回归方程能解释百分之多少的真实值。 Kmeans聚类大致就是选择K个中心点。不断遍历更新中心点的位置。离哪个中心点近就属于哪一类。中心点的更新取此类的平均点。 优点:速度快,原理简单 缺点:最终结果与初始点选择有段,容易陷入局部最优。并且还要提前知道K值 代码 1 import …
-
菜鸟之路——机器学习之KNN算法个人理解及Python实现
KNN(K Nearest Neighbor) 还是先记几个关键公式 距离:一般用Euclidean distance E(x,y)√∑(xi-yi)2 。名字这么高大上,就是初中学的两点间的距离嘛。 还有其他距离的衡量公式,余弦值(cos),相关度(correlation) 曼哈顿距离(manhatann distance)。我觉得针…
-
机器学习中规则化和模型选择知识
1 问题 模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归。那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)? 还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重w公式里的参数? 形式化定义:假设可选的模型集合是,比如我们想分类,那么SVM、logi…
-
机器学习工程师 – Udacity 机器学习毕业项目 算式识别
算式识别(挑战项目) import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt %matplotlib inline import numpy as np # 统计字符长度 def draw_hist(dat…
-
机器学习工程师 – Udacity 强化学习 Part Four
五、蒙特卡洛方法 1.状态值 如果你想详细了解首次经历和所有经历 MC 方法之间的区别,建议你阅读此论文的第 3 部分。结果在第 3.6 部分进行了总结。作者指出: 所有经历 MC 存在偏差,而首次经历 MC 不存在偏差(请参阅 Theorems 6 和 7)。 一开始,所有经历 MC 具有更低的均方误差 (MSE),但是随着经历更多的阶段,首次经历 MC …
-
机器学习第二周-模型评价(I)
对于新建的模型,如何评价其好坏,以及自身的泛化能力,是机器学习中一个关键性问题。对于二分类模型,因原始数据可能是非平衡的,因此仅通过最后的预测准确率并不能评价模型的效果,对于机器学习中的分类与回归两大类模型,需采用不同的模型评价指标。 一、分类模型 1.混淆矩阵、P-R曲线及F1分数 混淆矩阵(confusion matrix)实际是一张表…
-
《图解机器学习-杉山将著》读书笔记—CH3
CH3 最小二乘学习法 重点提炼 提出最小二乘学习法的缘故: 最小二乘学习法公式 对不同模型进行最小二乘法学习,得到最小二乘公式中的参数theta: 1.线性模型 代入3.1公式,对参数求偏导,偏导=0时误差J有极值,此时 ① 延伸1:线性模型中的基函数可以是三角多项式 ② 延伸2:加权最小二乘学习法 2.核模型 计算参数的方法与线性…
-
《图解机器学习-杉山将著》读书笔记—CH2
CH2 学习模型 重点提炼 学习模型作用: 使特定函数与数据集相近似 学习模型类型: 1.线性模型 (1)最简单的线性模型,缺点:只能表现线性的输入输出函数,不能很好地解决实际问题 (2)基于参数的线性模型,优势:适合实际应用 ① 第一种基函数可以是 ② 第二种基函数可以是 一维的输入x还可以扩展为d维的向量,会使用一维的基函数来构造多…
-
《图解机器学习-杉山将著》读书笔记—CH1
CH1 什么是机器学习 重点提炼 机器学习的种类: 常分为:监督学习、无监督学习、强化学习等 监督学习是学生从老师那获得知识,老师提供对错指示 无监督学习是在没有老师的情况下,学生自习 强化学习是在没有老师指示情况下,学生对预测的结果自我评估,学生为了获得老师的最高嘉奖而不断学习 监督学习应用:手写文字识别、声音处理、图像处理、垃圾邮件分类与拦截、网…