本文是作者通过对《机器学习实践》这本书的学习,下面做出了自己的学习笔记。文笔拙劣,望指正!

  机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。

  机器学习主要分为两种:一种是有监督学习,另一种是无监督学习。有监督学习就是在已知的数据样本的基础上进行分析和训练,得到分类数据模型,用于预测数值型数据。无监督学习则是对数据进行聚类。因此,机器学习的主要任务是分类。

  在将机器学习算法运用到实际项目的过程中,我们需要考虑哪些问题?

  1、如何选用合适的算法?

  要选择合适的算法,首先,提出两个问题:(1)要使用机器学习算法的目的;(2)分析收集的数据是什么。

  2、开发机器学习应用程序的步骤有哪些?

  (1)收集数据

  (2)准备输入数据

  (3)分析输入数据

  (4)训练算法

  (5)测试算法

  (6)使用算法

 

  机器学习相关学习资料总结:

  1. 《机器学习实践》PDF+Python源代码+相关学习资料网址

  2. 网易公开课 斯坦福大学 Andrew Ng 大牛主讲的《机器学习》课程

  3. coursera上的Ng 的教程https://www.coursera.org/learn/machine-learning

  4. Rachel-Zhang 对Ng的机器学习课的学习笔记

  5. JerryLead对Ng的机器学习课的学习笔记

  6. tornadomeet 的机器学习总结,其中还包括了深度学习的内容

  7. 11个开源机器学习项目