机器学习

  • 机器学习–数据挖掘算法(有监督)

    1 import numpy as np 2 import pandas as pd 3 import matplotlib.pyplot as plt 4 from math import sqrt 5 6 plt.rcParams[‘font.sans-serif’] = [‘Simhei’] 7 8 rowdata = {‘颜色深度’:[14.13,1…

    机器学习 2023年4月12日
    00
  • 译-机器学习的十大误解

    Pedro DomingosProfessor of computer science at U. Washington and author of “The Master Algorithm”. pedrodomingos.org 机器学习过去一直是幕后:亚马逊挖掘你的点击和购买数据来进行推荐,谷歌对搜索查询进行挖掘从而去做广告投放,而脸书会挖掘社交网络来…

    机器学习 2023年4月12日
    00
  • Spark0.9.0机器学习包MLlib-Optimization代码阅读

           基于Spark的一个生态产品–MLlib,实现了经典的机器学算法,源码分8个文件夹,classification文件夹下面包含NB、LR、SVM的实现,clustering文件夹下面包含K均值的实现,linalg文件夹下面包含SVD的实现(稀疏矩阵的表示),recommendation文件夹下面包含als,矩阵分解实现,regression文…

    机器学习 2023年4月12日
    00
  • Spark0.9.0机器学习包MLlib-Classification代码阅读

           本章主要讲述MLlib包里面的分类算法实现,目前实现的有LogisticRegression、SVM、NaiveBayes ,前两种算法针对各自的目标优化函数跟正则项,调用了Optimization模块下的随机梯度的优化,并行实现的策略主要在随机梯度的计算,而贝叶斯的的并行策略主要是计算类别的先验概率跟特征的条件概率上面,详细情况如下 Logi…

    机器学习 2023年4月12日
    00
  • 【机器学习】集成学习之sklearn中的xgboost基本用法

    原创博文,转载请注明出处!本文代码的github地址    博客索引地址 1.数据集       数据集使用sklearn自带的手写数字识别数据集mnist,通过函数datasets导入。mnist共1797个样本,8*8个特征,标签为0~9十个数字。 1 ### 载入数据 2 from sklearn import datasets # 载入数据集 3 d…

    机器学习 2023年4月12日
    00
  • 机器学习之开源库大总结

      研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的数据挖掘与机器学习软件(库)目前也十分必需,现在就跟大家介绍下比较流行和常用的机器学习开源库。   以前在学校用过matlab,说实话真方便,通常一个模型只要几十行甚至十几行代码就能搞定,但是…

    机器学习 2023年4月12日
    00
  • 为什么要学习机器学习?如何学习

    如果你是一个博士,那么很可能你的理想是提出一个被全世界广泛应用的算法,如EM,SVM等;如果你是一个硕士,那么很可能你的理想是把博士们提出的算法应用到实际的工程当中,我是一个硕士,我目前想做的事情,就是利用目前一些比较成熟的机器学习算法来解决实际工程中的问题。 不过最近比较纠结,怎样去进一步学习机器学习的算法。本来我的打算是阅读一些比较NB的书籍,如PC或者…

    机器学习 2023年4月12日
    00
  • 机器学习基础知识笔记(一)– 极大似然估计、高斯混合模型与EM算法

    常说的概率是指给定参数后,预测即将发生的事件的可能性。拿硬币这个例子来说,我们已知一枚均匀硬币的正反面概率分别是0.5,要预测抛两次硬币,硬币都朝上的概率: H代表Head,表示头朝上 p(HH | pH = 0.5) = 0.5*0.5 = 0.25. 这种写法其实有点误导,后面的这个p其实是作为参数存在的,而不是一个随机变量,因此不能算作是条件概率,更靠…

    机器学习 2023年4月12日
    00
  • 机器学习(一):梯度下降、神经网络、BP神经网络

          这几天围绕论文A Neural Probability Language Model 看了一些周边资料,如神经网络、梯度下降算法,然后顺便又延伸温习了一下线性代数、概率论以及求导。总的来说,学到不少知识。下面是一些笔记概要。 一、 神经网络       神经网络我之前听过无数次,但是没有正儿八经研究过。形象一点来说,神经网络就是人们模仿生物神经元…

    机器学习 2023年4月12日
    00
  • 机器学习之开源库

    研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、 Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的数据挖掘与机器学习软件(库)目前也十分必需,现在就跟大家介绍下比较流行和常用的机器学习开源库。   以前在学校用过matlab,说实话真方便,通常一个模型只要几十行甚至十几行代码就能搞定,但是正…

    机器学习 2023年4月12日
    00
合作推广
合作推广
分享本页
返回顶部