机器学习

  • 【ML】从Titannic说起一个完整机器学习的7步骤 【ML】数据清洗

    一个机器学习主要要经过如下几步:   这么一讲比较抽象,我拿Kaggle比赛中的泰坦尼克生存率预测为例子: 收集数据:https://github.com/cystanford/Titanic_Data 该数据集一共有俩个文件: train.csv:训练集,包含特征信息,分类结果(存活与否) test.csv:测试集,只包含特征信息 数据集中的字段内容如下,…

    机器学习 2023年4月13日
    00
  • 最大似然估计 (MLE)与 最大后验概率(MAP)在机器学习中的应用

    最大似然估计 MLE 给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参,即“模型已定,参数未知”。 例如,对于线性回归,我们假定样本是服从正态分布,但是不知道均值和方差;或者对于逻辑回归,我们假定样本是服从二项分布,但是不知道均值,逻辑回归公式得到的是因变量y的概率P = g(x), x为自变量,通过逻辑函数得到一个…

    机器学习 2023年4月13日
    00
  • 机器学习之路–朴素贝叶斯 机器学习实战之朴素贝叶斯

      一,引言   前两章的KNN分类算法和决策树分类算法最终都是预测出实例的确定的分类结果,但是,有时候分类器会产生错误结果;本章要学的朴素贝叶斯分类算法则是给出一个最优的猜测结果,同时给出猜测的概率估计值。 1 准备知识:条件概率公式 相信学过概率论的同学对于概率论绝对不会陌生,如果一时觉得生疏,可以查阅相关资料,在这里主要是想贴出条件概率的计算公式:  …

    机器学习 2023年4月13日
    00
  • 机器学习之路–KNN算法 机器学习实战之kNN算法

           机器学习实战这本书是基于python的,如果我们想要完成python开发,那么python的开发环境必不可少: (1)python3.52,64位,这是我用的python版本 (2)numpy 1.11.3,64位,这是python的科学计算包,是python的一个矩阵类型,包含数组和矩阵,提供了大量的矩阵处理函数,使运算更加容易,执行更加迅速…

    机器学习 2023年4月13日
    00
  • 机器学习之路–Numpy

    ndarray.dtype 数据类型必须是一样的 常用代码 import numpy #numpy读取文件 world_alcohol = numpy.genfromtxt(“world_alcohol.txt”, delimiter=”,”, dtype=str, skip_header=1) #<class ‘numpy.ndarray’> …

    机器学习 2023年4月13日
    00
  • 机器学习之路–解决机器学习问题有通法

      一个中等水平的数据科学家每天都要处理大量的数据。一些人说超过60%到70%的时间都用于数据清理、数据处理及格式转化,以便于在之后应用机器学习模型。 这篇文章的重点便在后者—— 应用机器学习模型(包括预处理的阶段)。此文讨论到的内容来源于我参加的过的数百次的机器学习竞赛。请大家注意这里讨论的方法是大体上适用的,当然还有很多被专业人士使用的非常复杂的方法。 …

    机器学习 2023年4月13日
    00
  • 机器学习之路–常用面试题目01

    1.特征工程 1.1为什么需要对数值类型进行归一化? 使各个指标处于同一数值量级,消除数据之间的量纲影响。 比如分析一个人的身高和体重对健康的影响。 1.2补充知识点 结构化数据:关系数据库的一张表,每列都有清晰的定义,包含了数值型和类别型 非结构化数据:文本,图像,音频,无法使用简单的数值表示,也没有清晰的类别定义,并且每条数据的大小各不相同 1.3方法 …

    机器学习 2023年4月13日
    00
  • 机器学习之路–Matplotlib

    1.绘制折线图 在pandas里面有一种数据类型为datatime ,可以将不规范的日期改为:xxxx-xx-xx import pandas as pd import numpy as np a = pd.read_csv(‘UNRATE.csv’) a[‘DATE’] = pd.to_datetime(a[‘DATE’]) print(a.head(12…

    机器学习 2023年4月13日
    00
  • 机器学习之路–Python

    1.list 列表 有序集合 classmates = [‘Michael’, ‘Bob’, ‘Tracy’] len(classmates) classmates[0] len(classmates) – 1 classmates[-1] classmates[-2] classmates.append(‘Adam’) classmates.insert(…

    机器学习 2023年4月13日
    00
  • 机器学习之路–seaborn

    seaborn是基于plt的封装好的库。有很强的作图功能。 1、布局风格设置(图形的style)and 细节设置 用matplotlib作图: import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt x = np.linspace(0, 14, 100) for …

    机器学习 2023年4月13日
    00
合作推广
合作推广
分享本页
返回顶部