本文是作者通过对《机器学习实践》这本书的学习,下面做出了自己的学习笔记。文笔拙劣,望指正!
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
机器学习主要分为两种:一种是有监督学习,另一种是无监督学习。有监督学习就是在已知的数据样本的基础上进行分析和训练,得到分类数据模型,用于预测数值型数据。无监督学习则是对数据进行聚类。因此,机器学习的主要任务是分类。
在将机器学习算法运用到实际项目的过程中,我们需要考虑哪些问题?
1、如何选用合适的算法?
要选择合适的算法,首先,提出两个问题:(1)要使用机器学习算法的目的;(2)分析收集的数据是什么。
2、开发机器学习应用程序的步骤有哪些?
(1)收集数据
(2)准备输入数据
(3)分析输入数据
(4)训练算法
(5)测试算法
(6)使用算法
机器学习相关学习资料总结:
1. 《机器学习实践》PDF+Python源代码+相关学习资料网址;
2. 网易公开课 斯坦福大学 Andrew Ng 大牛主讲的《机器学习》课程;
3. coursera上的Ng 的教程https://www.coursera.org/learn/machine-learning
4. Rachel-Zhang 对Ng的机器学习课的学习笔记;
6. tornadomeet 的机器学习总结,其中还包括了深度学习的内容;
7. 11个开源机器学习项目;
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:机器学习之一:初认识 - Python技术站