机器学习

  • Coursera机器学习week6 单元测试

    高方差,选B 出现过拟合问题,选BD 出现欠拟合问题,选BC 选AC  一般用 6 2 2来分,随机打乱数据是很有必要的。    选择BD A、出现高偏差,增加训练数据会增加测试误差 C、明显错的 week6 || Machine Learning System Design 求准确率 (85+10)/ 1000 = 0.095  选AB 选A CD明显错误…

    2023年4月9日
    00
  • Coursera机器学习week6 编程作业

    linearRegCostFunction.m J = 1/(2*m)*sum((X*theta-y).^2)+lambda/(2*m)*(sum(theta.^2)-theta(1).^2); grad = 1/m*X’*(X*theta-y)+lambda/m*theta; grad(1) = grad(1) -lambda/m*theta(1) lea…

    机器学习 2023年4月9日
    00
  • Coursera机器学习week7 编程作业

    gaussianKernel.m sim = exp(-sum((x1-x2).^2)/(sigma.^2*2));  dataset3Params.m steps = [0.01,0.03,0.1,0.3,1,3,10,30]; minError = Inf; minC = Inf; minSigma = Inf; for i = 1:length(ste…

    机器学习 2023年4月9日
    00
  • 机器学习之模型训练(二)皮马印第安人糖尿病数据集

    1. 数据说明: Pima Indians Diabetes Data Set(皮马印第安人糖尿病数据集) 根据现有的医疗信息预测5年内皮马印第安人糖尿病发作的概率。 数据链接:https://archive.ics.uci.edu/ml/datasets/Pima+Indians+Diabetes 2.来吧展示: 3.#数据预处理   # 导入数据处理包 …

    2023年4月9日
    00
  • 机器学习之高斯混合模型及EM算法

    第一部分: 这篇讨论使用期望最大化算法(Expectation-Maximization)来进行密度估计(density estimation)。       与k-means一样,给定的训练样本是,我们将隐含类别标签用表示。与k-means的硬指定不同,我们首先认为是满足一定的概率分布的,这里我们认为满足多项式分布,,其中,有k个值{1,…,k}可以选取。…

    2023年4月9日
    00
  • 机器学习之线性回归—logistic回归—softmax回归

    在本节中,我们介绍Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签 可以取两个以上的值。 Softmax回归模型对于诸如MNIST手写数字分类等问题是很有用的,该问题的目的是辨识10个不同的单个数字。Softmax回归是有监督的,不过后面也会介绍它与深度学习/无监督学习方法的结合。(译者注: MNIST 是…

    2023年4月9日
    00
  • 机器学习判断是过拟合还是欠拟合-学习曲线

    转自 :http://blog.csdn.net/aliceyangxi1987/article/details/73598857 学习曲线是什么? 学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或偏差过高,以及增大训练集是否可以减小过拟合。 怎么解读? 当训练集和测试集的误差收敛但却很…

    2023年4月9日
    00
  • (实战篇)使用Python清理机器学习的文本数据

    在自然语言处理(NLP)的过程中,我们不可能直接从原始文本转到拟合机器学习或深度学习模型,我们必须要首先清理文本,这意味着将其拆分为单词并处理标点符号和大小写。 事实上,您可能需要使用一整套文本准备方法,方法的选择实际上取决于您的自然语言处理任务。 在本教程中,您将了解如何清理和准备文本,以便使用机器学习进行建模。具体内容如下: 从如何通过开发自己的非常简单…

    2023年2月12日
    10
  • 2023年最全面最热门的机器学习算法

    在过去的几年里,我根据自己的工作经验、与其他数据科学家的对话以及我在网上阅读的内容,整理了我认为最重要的机器学习算法。 今年,我想通过提供更多类型的模型以及每个类别中的更多模型来扩展去年的文章。通过这个,我希望提供一个工具和技术的存储库,您可以将其添加为书签,以便您可以解决各种数据科学问题! 话虽如此,让我们深入研究六种最重要的机器学习算法: 解释性算法 模…

    2023年2月3日
    00
  • 适合初学者的8大最火爆的机器学习库!

    机器学习生态系统在过去十年中发展了很多。人工智能相关的社区已经发展的非常强大,开放、乐于助人是开源精神之一,这也让我们接触到很多优秀的机器学习库,帮助我们一步步成长。 本文就带您了解8大最火爆的机器学习库! 以下是根据使用目的不同,整理的一份最火爆的机器学习开源库,您可以收藏下来以便后续学习: 作用 开源库 科学计算 Numpy 数据处理 Pandas 数据…

    2023年1月12日
    10
合作推广
合作推广
分享本页
返回顶部