机器学习
-
[机器学习]-朴素贝叶斯-最简单的入门实战例子
简介 如果你有一个很大的数据集,有很多的变量,而且已知这是一个分类问题,你想快速的得到你的分类结果,那朴素贝叶斯是一个不错的选择,他比一般的分类算法都要快,他的理论基础是概率中的贝叶斯定理。 本文会介绍朴素贝叶斯的理论基础,以及一个基于python的实战例子,so,坐稳了,准备开车 目录 1.朴素贝叶斯是如何工作的? 2.朴素贝叶斯…
-
[机器学习]-K近邻-最简单的入门实战例子
本篇文章分为两个部分,前一部分主要简单介绍K近邻,后一部分是一个例子 第一部分–K近邻简介 从字面意思就可以容易看出,所谓的K近邻,就是找到某个样本距离(这里的距离可以是欧式距离,曼哈顿距离,切比雪夫距离等)最近的K个数据,根据最近的K个邻居属于什么分类,来判断这个样本属于什么分类。 简单说一下优缺点: 优点:简单,适合于多分类问题(mu…
-
[机器学习]-决策树-最简单的入门实战例子
本文主要介绍决策树的基本概念和如最简单的入门实例 第一部分–基本概念: 什么是决策树? 我不打算搞一段标准的定义放在这里,我个人理解是建立一个树来帮助决策,下面以一个图说明一下(注:图是盗别人的) 这就是一个决策树,从图中可以一目了然的了解决策树的概念,上面的图中只有一个属性来决定这个人是男还是女,一个属性往往决定的结…
-
机器学习之Hash集合问题
问题来源与七月学习之 (3.x线性代数与矩阵运算基础)
-
机器学习之回归
主要内容: 回归 1.线性回归 2.Logistic回归 最优问题: 1.梯度下降 2.牛顿法 3.拟牛顿法 了解参数学习算法和非参数学习算法的区别 高斯分布(正态分布) 1. 2.线性回归 考虑2个变量 多变量的情形 3.最小二乘的目标函数 m为样本个数,则一个比较“符合常理”的误差函数为: 符合常理 n最小二乘建立的目标函数,即是在噪声为均值为0的高…
-
机器学习之凸优化基础二
20.共轭函数 21.凸优化 优化问题的基本形式 告诉几个等式约束求最值 局部最优问题 22.非凸优化问题的变形 23.对偶问题 24.Lagrange对偶函数(dual function) Lagrange 对偶函数 若没有下确界,定义: 根据定义,显然有:对∀λ>0,∀v,若原优化问题有最优值p*,则 进一步:Lagrange对偶函数为…
-
机器学习的常见面试问题
1. 你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法? 答:推荐中用过CF,LR 分类中用过SVM,GBDT; 一般用法是什么,是不是自己实现的,有什么比较知名的实现,使用过程中踩过哪些坑; 优缺点分析。 2.你熟悉的机器学习/数据挖掘算法主要有哪些? 基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法,也适当说说应用场合; …
-
机器审核图片学习(2)安装pornDetector所用环境-python、scikit-learn、opencv
1.安装python 下载安装即可:最好是C盘 路径:https://www.python.org/ 将Python的安装路径加到path环境变量中,Python/Scripts加到path环境变量 命令行输入Python -V查看python版本 启动python : 命令行输入 python 2.安装pip 之前先暗转setuptools a) 下载路径…
-
机器学习综合库gensim 简单搞定文本相似度
不废话直接代码吧 # 1.模块导入 import jieba import gensim from gensim import corpora from gensim import models from gensim import similarities # 2.制作问题库 # 2.制作问题库 l1 = [“你叫什么名字”, “你的姓名是什么”, “你的…
-
【Python】Pandas读取 excel 机器学习之数据预处理,Pandas读取excel数据
CSV和EXCEL: excel文件和 csv 文件的区别在于前者有分页(sheet),而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 “,” 结尾,而 csv 是以制表 “\t” 结尾。注意一点的是,并不是所有得到文件其内容都很规范,比如在一个单元格里面有一大段句子含有英文逗号,就会导致生成 DataFrame 出现问题。所以在导…