机器学习
-
概念(机器学习):有监督、无监督、半监督学习
来源: 机器学习算法盘点 – ranjiewen – 博客园 http://www.cnblogs.com/ranjiewen/p/6235388.html 机器学习的算法很多。很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。 学习方式 根据数据类型的不同,对…
-
《机器学习及实践–从零开始通往Kaggle竞赛之路》
在开始说之前一个很重要的Tip:电脑至少要求是64位的,这是我的痛。 断断续续花了个把月的时间把这本书过了一遍。这是一本非常适合基于python入门的机器学习入门的书籍,全书通俗易懂且有代码提供。书中源代码连接为Ipython环境。主页君使用的是pycharm,python2.7,具体安转过程书本写的很详细。码完书中代码,有一点点点小不符(或许可能是因为平台…
-
机器学习算法之感知机
1.感知机模型 感知器模型只是适用于线性可分的二分类情况,例如有n个样本,x是n维的特征,y是二分标签{+1, -1},任务是找到一条超平面将样本中的正负样本分开。 具体的,如果我们有m个样本,每个样本都对应与n为特征和一个二分类别输出,如下 由输入空间到输出空间的函数为: 称为感知机,其中,w和b为感知机参数模型,w为一个n维行向量…
-
微软机器学习Azure Machine Learning入门概览
Azure Machine Learning(简称“AML”)是微软在其公有云Azure上推出的基于Web使用的一项机器学习服务,机器学习属人工智能的一个分支,它技术借助算法让电脑对大量流动数据集进行识别。这种方式能够通过历史数据来预测未来事件和行为,其实现方式明显优于传统的商业智能形式。微软的目标是简化使用机器学习的过程,以便于开发人员、业务分析师和数据科…
-
开启微软机器学习之旅(1)–如何从不同数据源将样本数据导入Azure Machine Learning Studio
当你打算通过Azure Machine Learning(简称“AML”) Studio构建一个预测模型,你需要做的第一步就是把训练数据导入到AML Studio中。首先你需要了解AML Studio已经内置了很多样本数据,如下图所示: 粗略统计大概有40+种样本数据,包括销售数字方面的、客户关系管理CRM方面的,防欺诈信用卡账单方面的,癌症相关的,电影分级…
-
解决Coursera平台上Andrew.Ng的机器学习课程无法正常提交编程作业的问题
课程链接:https://www.coursera.org/learn/machine-learning/home/welcome 我使用的环境是MATLAB R2016a,Win10系统。 执行submit命令并输入邮箱和token之后提示如下: 核心信息是这两行: !! Submission failed: 错误使用 submitWithConfigu…
-
机器学习核方法
目录 核方法 拉格朗日乘子法 等式约束条件 不等式约束条件 最大间隔(margin maximization) 问题描述 前序 SVM 最大分类问题 计算间距 问题转化 SVM 软间隔 拉格朗日对偶问题 引子 正文 支持向量 线性可分 拉格朗日乘子法 参考:【整理】深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT条件 参考:拉格朗日…
-
机器学习统计学习
目录 统计学习 EM算法 ( 期望最大算法,Expectation Maximum ) 隐含变量 隐含变量和概率分布的关系 举例 琴生不等式 琴生不等式在EM的应用 EM 算法公式表述 高斯混合模型 ( Gaussian Mixed Model, GMM) 二维混合模型 多维混合模型 隐马尔可夫模型 举例 前向后向算法 主题模型 Dirichlet 分布 前…
-
Python机器学习(5)——朴素贝叶斯分类器
朴素贝叶斯分类器是一个以贝叶斯定理为基础,广泛应用于情感分类领域的优美分类器。本文我们尝试使用该分类器来解决上一篇文章中影评态度分类。 1、贝叶斯定理 假设对于某个数据集,随机变量C表示样本为C类的概率,F1表示测试样本某特征出现的概率,套用基本贝叶斯公式,则如下所示: 上式表示对于某个样本,特征F1出现时,该样本被分为C类的条件概率。那么如何用上式来对测试…
-
Python机器学习(3)——KNN分类算法
1、KNN分类算法 KNN分类算法(K-Nearest-Neighbors Classification),又叫K近邻算法,是一个概念极其简单,而分类效果又很优秀的分类算法。 他的核心思想就是,要确定测试样本属于哪一类,就寻找所有训练样本中与该测试样本“距离”最近的前K个样本,然后看这K个样本大部分属于哪一类,那么就认为这个测试样本也属于哪一类。简单的说就是…