机器学习
-
机器学习:单元线性回归(python简单实现)
文章简介 使用python简单实现机器学习中单元线性回归算法。 算法目的 该算法核心目的是为了求出假设函数h中多个theta的值,使得代入数据集合中的每个x,求得的h(x)与每个数据集合中的y的差值的和最小。简单来说就是需要生成一个函数,它尽可能贴近实际数据中的每个值,方便我们预测。 核心算法 假设函数 即需要求的函数,为了简单在此只设置一个x对应一个y,求…
-
机器学习:正态方程 python实现
目录 前言 一、算法介绍 二、核心算法 1. 公式 2.python实现 总结 使用python简单实现机器学习中正态方程算法。 一、算法介绍 与梯度下降算法相比,正态方程同样用于解决最小化代价函数J,不同的是,梯度下降算法通过迭代计算获得最小J的theta值,而正态方程则是通过直接对J进行求导,直接获得满足条件的theta值。 二、核心算法 1. 公式 正…
-
机器学习小知识
||x||下标2表示2-范数,等于各分量x(i)的平方和再开方,也称做欧几里得距离.右上角就表示平方 在数学里面s.t.是subject to 的缩写,受约束的意思按中文习惯应该是 使得…满足…s.t.= subject to,受约束于数学习惯是“使得…满足…看了一篇论文里看到的,都是用在公式中的 符号∑表示几个数的和符号∏表示几个数的积 …
-
实例详解机器学习如何解决问题
原文出处:http://tech.meituan.com/mt-mlinaction-how-to-ml.html 前言 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解…
-
漫谈:机器学习中距离和相似性度量方法
原文出处: daniel-D 的博客(@迅猛龙Daniel ) 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,…
-
机器学习之逻辑回归
给定一张图片,如何让计算机帮助我们识别它是不是一张猫的图片,这个问题可以看成一个简单的分类问题。如下图所示,平面上有两种不同颜色(黑色,红色)的点,我们要做到就是要找到类似与那条直线那样的界限。当某个点位于直线上方时,那么就可以判定该点是黑色的,当某个点位于直线的下方时,那么就可以判定该点是红色的。 正向传播 正向传播考虑的是如何得到这条直线的方程,可以先…
-
不懂前端,我依然开发了一个机器学习APP
人人都知道学习很重要,学习究竟是为了什么呢?根本目的只有一个,学以致用! 机器学习,大家都学了很多算法,搞了很多模型,但是极少拿来解决实际问题。 毕竟开发一个机器学习应用需要的技术栈不是每个人都能掌握,今天就向同学们介绍一个绝佳解决方法————streamlit 它可以让你用Python用极短的时间快速生成一个实现机器学习的web应用 正式介绍之前,大家可以…
-
机器学习从入门到出家
| 导语 简述一个2010年入坑的后台如何转向做算法和机器学习的历程和感悟,附录一个书单 写在前面: 本文主要介绍的是自己的一些经历,以及读过的一些书,实际应用的经验并没有介绍,包括现在很多机器学习的书一般也是侧重于理论,结合实践的时候会发现和模型比起来,数据清洗、特征工程的实际效果更明显,而这方面很难有系统的理论知识,怎么办呢?读paper,去搜索自己应用…
-
机器学习算法思想梳理
朴素贝叶斯: 有以下几个地方需要注意: 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。 2. 计算公式如下: 其中一项条件概率可以通过朴素贝叶斯条件独立展开。要注意一点就是 的计算方法,而由朴素贝叶斯的前提假设可知,…
-
推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了
PS:文章主要转载自CSDN大神”黑夜路人”的文章: http://blog.csdn.NET/heiyeshuwu/article/details/43483655 本文主要对机器学习进行科普,包括机器学习的定义、范围、方法,包括机器学习的研究领域:模式识别、计算机视觉、语音识别、自然语言处理、统计学习和数据挖掘.这是一篇非常好…