机器学习
-
机器学习算法–聚类
聚类试图将数据集中的样本划分为若干个通常不相交的子集,每个子集称为一个“簇”。通常为“无监督学习”,对无标记训练样本学习来揭示数据的内在规律和性质。 下面主要讲三种聚类模型: 1. 原型聚类 “原型”是指样本空间中具有代表性的点。通常是算法先对原型进行初始化,然后对原型进行迭代更新求解。介绍三种著名的原型聚类方法。 (1)…
-
《机器学习》第一周 Introduction | 监督学习与非监督学习的基本概念
课程视频地址:https://www.coursera.org/learn/machine-learning/lecture/1VkCb/supervised-learning 监督学习:给出一个算法,需要部分数据集已经有正确答案。比如给出给定房价数据集,对于里面每个数据,算法都能计算出对应的正确房价。算法的结果就是短处更多的正确价格。 像房价预…
-
机器学习中的数学-强大的矩阵奇异值分解(SVD)及其应用
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy 前言: 上一次写了关于PCA与LDA的 文章,PCA的实现一般有两种,一种是用特征…
-
郑捷《机器学习算法原理与编程实践》学习笔记(第四章 推荐系统原理)(二)kmeans
(上接第二章) 4.3.1 KMeans 算法流程 算法的过程如下: (1)从N个数据文档随机选取K个文档作为质心 (2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类 (3)重新计算已经得到的各个类的质心 (4)迭代(2)~(3)步直至新的质心与原质心相等或者小于指定阀值,算法结束。 4.3.2 辅助函数 …
-
机器学习笔记(一)机器学习与数学分析
一、什么是机器学习 (一) 对于给定的任务T,在合理的性能度量方案P的前提之下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。 机器学习是人工智能的一个分支。我们使用计算机设计一个系统,使他能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进;通过参数…
-
Python_sklearn机器学习库学习笔记(七)the perceptron(感知器)
一、感知器 感知器是Frank Rosenblatt在1957年就职于Cornell航空实验室时发明的,其灵感来自于对人脑的仿真,大脑是处理信息的神经元(neurons)细胞和链接神经元细胞进行信息传递的突触(synapses)构成。 一个神经元可以看做将一个或者多个输入处理成一个输出的计算单元。一个感知器函数类似于一个神经元:它接受一个或…
-
机器学习|算法模型——K近邻法(KNN)
1、基本概念 K近邻法(K-nearest neighbors,KNN)既可以分类,也可以回归。 KNN做回归和分类的区别在于最后预测时的决策方式。 KNN做分类时,一般用多数表决法 KNN做回归时,一般用平均法。 基本概念如下:对待测实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K…
-
Python机器学习:泰坦尼克号获救预测一
数据集下载地址: https://github.com/fayduan/Kaggle_Titanic/blob/master/train.csv 视频地址: http://study.163.com/course/courseLearn.htm?courseId=1003551009#/learn/video?lessonId=1004052093&…
-
PCB 机器学习(ML.NET)初体验实现PCB加投率预测
使用ML.NET建立PCB加投率模型对单一蚀刻工序进行加投率预测, 此实例为最简单预测,要想实现全流程加投率预测挑战难度还是挺大的,可以查看另一种关于大数据在PCB行业应用—加投率计算基本原理:PCB 加投率计算实现基本原理–K最近邻算法(KNN) 一.PCB加投数据结构 建立数据结构,蚀刻工序影响报废的的关键参数,铜厚、线宽…
-
python机器学习简介
目录 一:学习机器学习原因和能够解决的问题 1.原因 2.机器学习能够解决的问题 二:为什么选择python作为机器学习的语言 三:机器学习常用库简介 1.scikit-learn 2.Jupyter notebook 3.NumPy 4.SciPy 5.matplotlib 6.pandas 7.mglearn 8.导入机器学习常用库 四:机器学习流程 1…