机器学习
-
机器学习之杂乱笔记
https://tensorflow.google.cn/tutorials/representation/word2vec 暂时我们使用 vanilla 定义,将“上下文”定义为目标字词左侧和右侧的字词窗口 通过噪声对比训练进行扩展 神经概率语言模型一直以来都使用最大似然率 (ML) 原则进行训练,以最大限度地提高使用 softmax 函数根据之前的字…
-
机器学习笔记3:朴素贝叶斯
目录 原理 举例 总结 实践 1. 对数据预处理 2. TF-IDF处理(获取数据特征,数据label) 3. 用朴素贝叶斯进行训练和预测 贝叶斯的完整推导 原理 举例 假设:有360封电子邮件,其中:正常邮件=240封,垃圾邮件=120封; 分词在邮件中出现次数如下: 件内容), 则可以认为是垃圾邮件如果P(垃圾|邮件内容) <= P(正常|邮件内容…
-
机器学习笔记6:K-Means
目录 目标函数 目标函数的表现函数 针对u和r求解: 最优解的表达式的意义: K-means聚类的形象化展示 聚类前 第一轮循环 第二轮循环 第三轮循环 最终结果 演示代码: 关于K-means的几个问题 可以做的事情 对用户进行分层 图像处理 目标函数 目标函数的表现函数 假设:点集合为D,所有分类的中心点解和为M,如下: \[D= [X_1,X_2,..…
-
机器学习中的生成模式和判别模式
参考网址:http://blog.163.com/huai_jing@126/blog/static/1718619832011227757554/ 常见的生成式模型 判别式分析 朴素贝叶斯Native Bayes 混合高斯型Gaussians K近邻KNN 隐马尔科夫模型HMM 贝叶斯网络 sigmoid belief networks 马尔科夫随机场Ma…
-
体验机器学习编程
最近看有人发了机器学习的培训挺便宜的,就尝试了一下。 讲的比较基础,很适合入门,用来了解这个行业。即使不从事此行业,用工具去画一个数学模型的图也是好的。 其他的各种机器学习概念,高数离散等数学基础知识都一样,没什么可写的。 只有安装的工具和使用方法,值得记录一下。 1.安装anaconda 到anaconda官网,下载安装就行,不过记住安装的时候选上注册环境…
-
机器学习之逻辑回归详解
目录 线性回归 方程 损失函数 求导 令导数为0,得到 逻辑回归 逻辑回归函数 逻辑回归函数如何解决二元分类过程? 逻辑回归的损失函数 梯度下降法 为什么?(逻辑回归的损失函数) 似然函数 推导损失函数 推导出梯度值 参考地址:https://www.zhihu.com/question/65350200https://github.com/GreedyAI…
-
机器学习笔记2:线性回归、逻辑回归
机器学习本周讲的是线性回归、逻辑回归原理见上一篇博客:https://www.cnblogs.com/bugutian/p/11123484.html课程资料:https://github.com/GreedyAIAcademy/Machine-Learning 目录 线性回归 1. 可以使用tushare爬取股票代码 2. 零散的小知识 逻辑回归 逻辑回归…
-
机器学习笔记4:SVM支持向量积的推导过程
内容来自:https://github.com/GreedyAIAcademy/Machine-Learning 最初 支持向量机的目的:找到一条好的分割线什么杨的分割线最好?有最大间隔的分割线最好。 推导过程 Support Vector是被选中用于计算的点,也就是距离分界线最近的几个点。 显然d1+d2=“向量(x1-x2)的模”*cosθ。根据向量内机…
-
机器学习笔记1:机器学习中的一些基本概念
目录 机器学习资料地址 机器学习的相关概念 1.什么是机器学习? 2.监督学习和非监督学习的区别? 3.机器学习的流程 4.数据预处理 5. 第一次作业 KNN相关的概念 1.KNN的关键步骤? 2.如何寻找决策边界? 3.交叉验证中要注意的问题? 4. 5折交叉验证? 5.如何处理大数据量? 6. 如何处理数据之间的相关性 7. 怎样处理样本的重要性 8.…
-
机器学习笔记5:决策树
目录 决策树公式 1.信息熵 2.条件熵 3.信息增益 4. 信息熵举例 5. 信息增益举例 决策树举例 表格 预设 手动计算 决策树特征的重要性 随机森林 集成学习 随机性体现在两点: 有两个优势: 决策树公式 1.信息熵 \[H(X)=-\sum_{i=1}^{n}P(X=i)log_{2}P(X=i) \] 2.条件熵 \[H(X|Y)=-\sum_{…