《python机器学习—预测分析核心算法》：构建预测模型的一般流程

2023年4月11日上午2:40 • 机器学习

参见原书1.5节

构建预测模型的一般流程

问题的日常语言表述->问题的数学语言重述
重述问题、提取特征、训练算法、评估算法

熟悉不同算法的输入数据结构：
1.提取或组合预测所需的特征
2.设定训练目标
3.训练模型
4.评估模型在训练数据上的性能表现

机器学习：
开发一个可以实际部署的模型的全部过程，包括对机器学习算法的理解和实际的操作

通常，有非常切实的原因，导致某些算法被经常使用，了解背后的原因

(1)构造一个机器学习问题
审视数据集中的数据，确定需要做何种形式的预测
如，这些数据代表什么？如何与预测任务关联起来？

1.“更好的结果”->可测量可优化的具体目标
2.收集数据，表示为特征的矩阵
3.目标：已知正确的数据结果用于训练

<------问题重构---------<-
| |
问题的定性描述->问题的数学描述->模型训练与性能评估->模型部署

(2)特征提取和特征工程
特征提取： (将决定哪些特征可以用来预测目标)
把一个自由形式的各种数据(如一个文档中的字词)转换为行、列形式的数字的过程

特征工程：
对特征进行整理组合，以达到更富有信息量的过程

算法，提供每个特征对最终预测结果贡献的度量
对特征打分，标识重要性

注意：数据准备和特征工程估计会占开发一个机器学习模型80%~90%的时间

通常训练100~5000个不同的模型，然后选择与问题、数据集最匹配的模型

(3)确定训练后模型的性能
测试集：留出一部分数据，用于测试模型的性能

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：《python机器学习—预测分析核心算法》：构建预测模型的一般流程 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

《机器学习》西瓜书习题第 1 章

上一篇 2023年4月11日

《python机器学习—预测分析核心算法》：理解数据

下一篇 2023年4月11日

目标检测

Yolov1目标检测算法详细分析

Yolov1目标检测算法详细分析 Yolov1介绍这是继RCNN，fast-RCNN 和 faster-RCNN之后，rbg（Ross Girshick）大神挂名的又一大作，起了一个很娱乐化的名字：YOLO。虽然目前版本还有一些硬伤，但是解决了目前基于DL检测中一个大痛点，就是速度问题。其增强版本GPU中能跑45fps，简化版本155fps。 YOLO…

2023年4月8日
000
Keras

keras人工神经网络构建入门

//2019.07.29-301、Keras 是提供一些高度可用神经网络框架的 Python API ，能帮助你快速的构建和训练自己的深度学习模型，它的后端是 TensorFlow 或者 Theano 。 2、Keras 被认为是构建神经网络的未来，以下是一些它流行的原因：(1)轻量级和快速开发：Keras的目的是在消除样板代码。几行Keras代码就能比原生…

2023年4月6日
000
卷积神经网络

MINST手写数字识别（二）—— 卷积神经网络（CNN）

今天我们的主角是keras，其简洁性和易用性简直出乎David 9我的预期。大家都知道keras是在TensorFlow上又包装了一层，向简洁易用的深度学习又迈出了坚实的一步。所以，今天就来带大家写keras中的Hello World ，做一个手写数字识别的cnn。回顾cnn架构：我们要处理的是这样的灰度像素图：我们先来看…

2023年4月7日
000
目标检测

目标检测算法之Fast R-CNN算法详解

在介绍Fast R-CNN之前我们先介绍一下SPP Net 一、SPP Net SPP：Spatial Pyramid Pooling（空间金字塔池化）众所周知，CNN一般都含有卷积部分和全连接部分，其中，卷积层不需要固定尺寸的图像，而全连接层是需要固定大小的输入。所以当全连接层面对各种尺寸的输入数据时，就需要对输入数据进行crop（crop就是从一个大…

2023年4月8日
000
吴恩达机器学习复习1：监督学习、无监督学习、模型表示、损失函数、直觉Ⅰ、直觉Ⅱ、梯度下降及其直觉、线性回归的梯度下降

【说在前面】 1.只是知道算法和数学，而不知道如何将算法实际运用于你所关心的问题并不是一件好事。 2.花点时间做些有关算法每个步骤的练习，看看你能否理解它们是如何工作的。【机器学习定义】不用精确编程也能让计算机有能力学习的研究领域（Arthur Samuel，older, informal）从经验中学习关于某些类别的任务T和表现度量P，并且在做任务T时…

机器学习 2023年4月11日
000
模型参数与超参数的区别

模型参数和超参数是机器学习模型中两个非常重要的概念，两者的区别不同但却很容易混淆。模型参数模型参数是指在训练过程中可以通过优化算法学习到的、用于决定模型预测值的内部变量。这些参数是模型的一部分，用于进行最终预测，因此它们的值在训练完毕后是固定的，不能再次修改。举个简单例子，对于线性回归模型，它的参数就是权重和截距，它们的值是在训练过程中被学习得到的。下…

artificial-intelligence 2023年3月27日
000
图像处理

什么是Stable Diffusion？Stable Diffusion AI绘画初学者终极指南！

前言 2023年被称为AI元年，因为在这一年，AI技术已经全面提升到了能够产生实际应用的层面。不管是文本生成技术ChatGPT、图像生成技术Midjourney，都是在今年彻底大爆发，不仅引爆互联网，还我们见识到了人工智能巨大的潜能，甚至有很多人认为这是第三次工业革命的开端！今年3月份，发布于2022年11月30日发布的ChatGPT突然爆火，让OpenA…

2023年7月11日
005
目标检测

Yolov5——训练目标检测模型

项目的克隆打开yolov5官网（GitHub – ultralytics/yolov5 at v5.0），下载yolov5的项目：环境的安装（免额外安装CUDA和cudnn）打开anaconda的终端，创建新的名为yolov5的环境（python选择3.8版本）： conda create -n yolov5 python=3.8 执行如下命令，激活…

2023年4月5日
000

合作推广

合作推广

返回顶部