机器学习 Archives - Page 14 of 72

机器学习之杂乱笔记

https://tensorflow.google.cn/tutorials/representation/word2vec 暂时我们使用 vanilla 定义，将“上下文”定义为目标字词左侧和右侧的字词窗口通过噪声对比训练进行扩展神经概率语言模型一直以来都使用最大似然率 (ML) 原则进行训练，以最大限度地提高使用 softmax 函数根据之前的字…

机器学习 2023年4月13日

000

机器学习笔记3:朴素贝叶斯

目录原理举例总结实践 1. 对数据预处理 2. TF-IDF处理(获取数据特征,数据label) 3. 用朴素贝叶斯进行训练和预测贝叶斯的完整推导原理举例假设:有360封电子邮件,其中：正常邮件=240封,垃圾邮件=120封; 分词在邮件中出现次数如下: 件内容), 则可以认为是垃圾邮件如果P(垃圾|邮件内容) <= P(正常|邮件内容…

机器学习 2023年4月13日

000

机器学习笔记6：K-Means

目录目标函数目标函数的表现函数针对u和r求解: 最优解的表达式的意义： K-means聚类的形象化展示聚类前第一轮循环第二轮循环第三轮循环最终结果演示代码：关于K-means的几个问题可以做的事情对用户进行分层图像处理目标函数目标函数的表现函数假设：点集合为D，所有分类的中心点解和为M，如下： \[D= [X_1,X_2,..…

机器学习 2023年4月13日

000

机器学习中的生成模式和判别模式

参考网址：http://blog.163.com/huai_jing@126/blog/static/1718619832011227757554/ 常见的生成式模型判别式分析朴素贝叶斯Native Bayes 混合高斯型Gaussians K近邻KNN 隐马尔科夫模型HMM 贝叶斯网络 sigmoid belief networks 马尔科夫随机场Ma…

机器学习 2023年4月13日

000

体验机器学习编程

最近看有人发了机器学习的培训挺便宜的，就尝试了一下。讲的比较基础，很适合入门，用来了解这个行业。即使不从事此行业，用工具去画一个数学模型的图也是好的。其他的各种机器学习概念，高数离散等数学基础知识都一样，没什么可写的。只有安装的工具和使用方法，值得记录一下。 1.安装anaconda 到anaconda官网，下载安装就行，不过记住安装的时候选上注册环境…

机器学习 2023年4月13日

000

机器学习之逻辑回归详解

目录线性回归方程损失函数求导令导数为0，得到逻辑回归逻辑回归函数逻辑回归函数如何解决二元分类过程？逻辑回归的损失函数梯度下降法为什么?（逻辑回归的损失函数）似然函数推导损失函数推导出梯度值参考地址：https://www.zhihu.com/question/65350200https://github.com/GreedyAI…

机器学习 2023年4月13日

000

机器学习笔记2:线性回归、逻辑回归

机器学习本周讲的是线性回归、逻辑回归原理见上一篇博客：https://www.cnblogs.com/bugutian/p/11123484.html课程资料：https://github.com/GreedyAIAcademy/Machine-Learning 目录线性回归 1. 可以使用tushare爬取股票代码 2. 零散的小知识逻辑回归逻辑回归…

机器学习 2023年4月13日

000

机器学习笔记4:SVM支持向量积的推导过程

内容来自：https://github.com/GreedyAIAcademy/Machine-Learning 最初支持向量机的目的：找到一条好的分割线什么杨的分割线最好？有最大间隔的分割线最好。推导过程 Support Vector是被选中用于计算的点，也就是距离分界线最近的几个点。显然d1+d2=“向量(x1-x2)的模”*cosθ。根据向量内机…

机器学习 2023年4月13日

000

机器学习笔记1:机器学习中的一些基本概念

目录机器学习资料地址机器学习的相关概念 1.什么是机器学习？ 2.监督学习和非监督学习的区别？ 3.机器学习的流程 4.数据预处理 5. 第一次作业 KNN相关的概念 1.KNN的关键步骤？ 2.如何寻找决策边界？ 3.交叉验证中要注意的问题？ 4. 5折交叉验证？ 5.如何处理大数据量？ 6. 如何处理数据之间的相关性 7. 怎样处理样本的重要性 8.…

机器学习 2023年4月13日

000

机器学习笔记5：决策树

目录决策树公式 1.信息熵 2.条件熵 3.信息增益 4. 信息熵举例 5. 信息增益举例决策树举例表格预设手动计算决策树特征的重要性随机森林集成学习随机性体现在两点：有两个优势：决策树公式 1.信息熵 \[H(X)=-\sum_{i=1}^{n}P(X=i)log_{2}P(X=i) \] 2.条件熵 \[H(X|Y)=-\sum_{…

机器学习 2023年4月13日

000