机器学习 Archives - Page 34 of 72

《从机器学习到深度学习》笔记（4）划分数据集

任何机器学习算法都是基于对已有数据集或环境的信息挖掘，要求将从现有数据学习得到的模型能够适配于未来的新数据。 1. 训练集（Training set）与测试集（Test set）很自然的，在评估模型能力的时候需要采用与模型训练时不同的数据集，因此在训练模型之前需要将已有数据集划分成如图1-13的两部分。图1-13 训练集与测试集顾名思义，图中的训练…

机器学习 2023年4月12日

000

耗时一个月，我做了一个纯粹的机器学习网站

同学们好写文章两年多了，积累了许多文章，很多同学私聊技术问题，其实之前都推送过相关内容，但是公众号很难把历史文章系统化，看起来很不方便，也不容易搜索。最近我整理了所有文章，把他们分门别类写成了一个网站。实现起来简单到离谱，感兴趣的同学可以看看：Bookdown+github.io 网站目录如下：欢迎收藏一波，有问题在网页左上角搜索????即可里面很多内…

机器学习 2023年4月12日

000

太强了，机器学习代码，自动生成！

最近在玩streamlit Streamlit 是第一个专门针对机器学习的应用开发框架，是开发自定义机器学习工具最快的方法，它的目标是取代Flask在机器学习项目中的地位。在Streamlit官方网站，有很多开源的应用，涉及NLP、数据可视化、音频处理、机器学习建模及训练等等今天向大家介绍2个我觉得非常有趣的项目：playground和Code Gene…

机器学习 2023年4月12日

000

建一个网站，用机器学习挑西瓜

在机器学习领域，有一个很有名气的西瓜–周志华老师的《机器学习》，很多同学选择这本书入门，都曾有被西瓜支配的恐惧。我写文章的时候也特别喜欢用西瓜数据集，以它为例手算+可视化讲解过XGBoost，自认非常通俗易懂。最近我介绍了决策树的可视化，还有可以快速实现机器学习web应用的神器——streamlit 今天我们就把它们结合起来，用机器学习帮华强挑西瓜！仅供…

机器学习 2023年4月12日

000

机器学习概念之特征选择（Feature selection）之RFormula算法介绍 Spark MLlib编程API入门系列之特征选择之R模型公式（RFormula）

　　不多说，直接上干货！ RFormula算法介绍： RFormula通过R模型公式来选择列。支持R操作中的部分操作，包括‘~’, ‘.’, ‘:’, ‘+’以及‘-‘，基本操作如下： 1、 ~分隔目标和对象 2、+合并对象，“+ 0”意味着删除空格 3、 :交互（数值相乘，类别二值化） 4、. 除了目标外的全部列 …

机器学习 2023年4月12日

000

【机器学习PAI实战】—— 玩转人工智能之美食推荐

前言在生活中，我们经常给朋友推荐一些自己喜欢的东西，也时常接受别人的推荐。怎么能保证推荐的电影或者美食就是朋友喜欢的呢？一般来说，你们两个人经常对同一个电影或者美食感兴趣，那么你喜欢的东西就很大程度上朋友也会比较感兴趣。在大数据的背景下，算法会帮我寻找兴趣相似的那些人，并关注他们喜欢的东西，以此来给我们推荐可能喜欢的事物。场景描述某外卖店铺收集了一些用…

机器学习 2023年4月12日

000

机器学习之K近邻算法（KNN）

标签： python 算法 KNN 机械学习苛求真理的欲望让我想要了解算法的本质，于是我开始了机械学习的算法之旅 from numpy import * import operator from collections import Counter #KNN需要测试集，训练集，标签和k值 #测试集：你需要测试的数据 #训练集：给定的标准数据 #标签：每个标…

机器学习 2023年4月12日

000

[Machine Learning] 国外程序员整理的机器学习资源大全

1. C++ 1.1 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库，新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口，并支持Windows, Linux, Android and Mac OS操作系统。 1.2 机器学习 MLPack DLib ecogg shark 回到顶部 2. …

机器学习 2023年4月12日

000

机器学习实战__KNN1

KNN的算法工作原理：　　存在一个训练样本集合，样本集中每个数据都有确定的标签（分类），即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。一般来说，我们只选择样本数据集中前K个最相似的数据，这就是K-近邻算法中K的出处,通常K是…

机器学习 2023年4月12日

000

机器学习实战__安装python环境

环境：win7 64位系统第一步：安装python 　　1、下载python2.7.3 64位 msi 版本（这里选择了很多2.7的其他更高版本导致安装setuptools失败，也不知道是什么原因，暂时不管，总之选择这个版本就可以了）　　2、安装python，全部next点下去。　　3、配置一下环境变量，我是默认将C:\Python添加path即可第…

机器学习 2023年4月12日

000