机器学习
-
《从机器学习到深度学习》笔记(4)划分数据集
任何机器学习算法都是基于对已有数据集或环境的信息挖掘,要求将从现有数据学习得到的模型能够适配于未来的新数据。 1. 训练集(Training set)与测试集(Test set) 很自然的,在评估模型能力的时候需要采用与模型训练时不同的数据集,因此在训练模型之前需要将已有数据集划分成如图1-13的两部分。 图1-13 训练集与测试集 顾名思义,图中的训练…
-
耗时一个月,我做了一个纯粹的机器学习网站
同学们好写文章两年多了,积累了许多文章,很多同学私聊技术问题,其实之前都推送过相关内容,但是公众号很难把历史文章系统化,看起来很不方便,也不容易搜索。 最近我整理了所有文章,把他们分门别类写成了一个网站。实现起来简单到离谱,感兴趣的同学可以看看:Bookdown+github.io 网站目录如下: 欢迎收藏一波,有问题在网页左上角搜索????即可 里面很多内…
-
太强了,机器学习代码,自动生成!
最近在玩streamlit Streamlit 是第一个专门针对机器学习的应用开发框架,是开发自定义机器学习工具最快的方法,它的目标是取代Flask在机器学习项目中的地位。 在Streamlit官方网站,有很多开源的应用,涉及NLP、数据可视化、音频处理、机器学习建模及训练等等 今天向大家介绍2个我觉得非常有趣的项目:playground和Code Gene…
-
建一个网站,用机器学习挑西瓜
在机器学习领域,有一个很有名气的西瓜–周志华老师的《机器学习》,很多同学选择这本书入门,都曾有被西瓜支配的恐惧。我写文章的时候也特别喜欢用西瓜数据集,以它为例手算+可视化讲解过XGBoost,自认非常通俗易懂。 最近我介绍了决策树的可视化,还有可以快速实现机器学习web应用的神器——streamlit 今天我们就把它们结合起来,用机器学习帮华强挑西瓜!仅供…
-
机器学习概念之特征选择(Feature selection)之RFormula算法介绍 Spark MLlib编程API入门系列之特征选择之R模型公式(RFormula)
不多说,直接上干货! RFormula算法介绍: RFormula通过R模型公式来选择列。支持R操作中的部分操作,包括‘~’, ‘.’, ‘:’, ‘+’以及‘-‘,基本操作如下: 1、 ~分隔目标和对象 2、+合并对象,“+ 0”意味着删除空格 3、 :交互(数值相乘,类别二值化) 4、. 除了目标外的全部列 …
-
【机器学习PAI实战】—— 玩转人工智能之美食推荐
前言 在生活中,我们经常给朋友推荐一些自己喜欢的东西,也时常接受别人的推荐。怎么能保证推荐的电影或者美食就是朋友喜欢的呢?一般来说,你们两个人经常对同一个电影或者美食感兴趣,那么你喜欢的东西就很大程度上朋友也会比较感兴趣。在大数据的背景下,算法会帮我寻找兴趣相似的那些人,并关注他们喜欢的东西,以此来给我们推荐可能喜欢的事物。 场景描述 某外卖店铺收集了一些用…
-
机器学习之K近邻算法(KNN)
标签: python 算法 KNN 机械学习 苛求真理的欲望让我想要了解算法的本质,于是我开始了机械学习的算法之旅 from numpy import * import operator from collections import Counter #KNN需要测试集,训练集,标签和k值 #测试集:你需要测试的数据 #训练集:给定的标准数据 #标签:每个标…
-
[Machine Learning] 国外程序员整理的机器学习资源大全
1. C++ 1.1 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。 1.2 机器学习 MLPack DLib ecogg shark 回到顶部 2. …
-
机器学习实战__KNN1
KNN的算法工作原理: 存在一个训练样本集合,样本集中每个数据都有确定的标签(分类),即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前K个最相似的数据,这就是K-近邻算法中K的出处,通常K是…
-
机器学习实战__安装python环境
环境:win7 64位系统 第一步:安装python 1、下载python2.7.3 64位 msi 版本(这里选择了很多2.7的其他更高版本导致安装setuptools失败,也不知道是什么原因,暂时不管,总之选择这个版本就可以了) 2、安装python,全部next点下去。 3、配置一下环境变量,我是默认将C:\Python添加path即可 第…