机器学习之主成分分析(PCA&特征选择)

2023年4月16日下午9:05 • 机器学习

yizhihongxing

特征选择

　　特征选择对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。

特征选择主要有两个功能：

(1)减少特征数量、降维，使模型泛化能力更强，减少过拟合
(2)增强对特征和特征值之间的理解

　　拿到数据集，一个特征选择方法，往往很难同时完成这两个目的。

PCA

　　PCA是一种数学降维方法，利用正交变换把一系列可能线性相关的变量转换为一组线性不相关的新变量，也称为主成分，从而利用新变量在更小的维度下展示数据的特征。
　　主成分是原有变量的线性组合，其数目不多于原始变量。组合之后，相当于我们获得了一批新的观测数据，这些数据的含义不同于原有数据，但包含了之前数据的大部分特征，并且有着较低的维度，便于进一步的分析。

　　主成分分析的意义:

　　　　(1)简化运算

　　　　(2)去除数据噪音

　　　　(3)可视化高维数据（利用散点图实现高维数据可视化）

　　　　(4)发现隐性相关变量

阐述出两者的主要区别

　　PCA可用于简化运算，可视化高维数据，发现隐性相关变量，就拿画散点图来说特征选择是通过与实际值相关性强弱选择出最大相关性的特征如朝向和房价、建筑面积和房价，显然建筑面积和房价相关性高些，所以特征选择的横坐标选择建筑面积最为合适；而PCA可以将朝向和建筑面积两个特征合为一个特征，当为散点图的横坐标，这体现出PCA的实用性。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习之主成分分析(PCA&特征选择) - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Python 最简实现逻辑回归，针对二维数据进行机器学习

上一篇 2023年4月16日

Machine Learning 之一，什么是机器学习。

下一篇 2023年4月16日

Keras

基于Python、Keras和OpenCV的实时人脸活体检测

作者|Jordan Van Eetveldt编译|Flin来源|towardsdatascience 你在互联网上找到的大多数人脸识别算法和研究论文都遭受照片攻击。这些方法在检测和识别来自网络摄像头的图像、视频和视频流中的人脸方面非常有效。然而，他们无法区分现实生活中的面孔和照片上的面孔。这种无法识别人脸的现象是由于这些算法在二维帧上工作。现在让我们想象一…

2023年4月8日
000
tensorflow 数据预处理

import tensorflow as tffrom tensorflow import kerasdef preprocess(x,y): x = tf.cast(x, dtype = tf.float32) /255. y = tf.cast(y, dtype = tf.int64) y = tf.one_hot(y,depth = 10) print…

tensorflow 2023年4月6日
000
用Cmake安装Caffe，以及Caffe单个文件编译

Cmake 安装 Caffe 首先修改Cmake里面的参数(GPU, CPU,MatLab,Python等); 修改 cmake/Dependencies.cmake 中的配置(BLAS之类的); Cmake：cd caffe && mkdir build && cd buildcmake .. -DBUILD_SHARED_…

Caffe 2023年4月8日
000
keras常用的网络层

一、常用层常用层对应于core模块，core内部定义了一系列常用的网络层，包括全连接、激活层等。 1.Dense层 Dense层：全连接层。 keras.layers.core.Dense(output_dim, init=’glorot_uniform’, activation=’linear’, weights=None, W_regularizer=…

Keras 2023年4月6日
000
机器学习训练模型的一般错误

在我们构建完机器学习模型，经常会遇到训练得到模型无法正确预测，这之后我们往往会采取下面的一些方案：增加训练数据减少特征的个数增加更多的特征增加多项式特征（X1*X2 …）增大lambda的值减小lambda的值若是不了解模型具体的问题所在，而根据随便拿出一个方案去试错，这往往都是既费力又费心，往往个把月过去了仍然在进行模型的调试。 CV 数…

机器学习 2023年4月11日
000
卷积神经网络

FCN-全卷积网络

CNN 与 FCN 通常CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图(feature map)映射成一个固定长度的特征向量。以AlexNet为代表的经典CNN结构适合于图像级的分类和回归任务，因为它们最后都期望得到整个输入图像的一个数值描述（概率），比如AlexNet的ImageNet模型输出一个1000维的向量表示输入图像属于每一类的…

2023年4月8日
000
目标检测

显著性目标检测——Stacked Cross Refinement Network for Edge-Aware Salient Object Detection（SCRN）

文章目录摘要简介显著目标检测的发展历程 SCRN基本设计思路主要工作总结具体方法分析边缘与分割的相互关系网络架构特征提取交叉优化单元CRU 点对点样式（Point-to-Point style）定点样式（Set-to-Point Style）选择性定点样式（Selective Set-to-Point Style）摘要显著物体检测是…

2023年4月8日
000
卷积的参数计算

假设一个卷积层的输入的特征图（feature maps）数量（input channels）为“n”，输出为特征图数量为“m”，卷积核（kernel size）为“k”。假设我们处理的是一个2D的卷积操作，卷积层对应的输入的参数量为k * k * n，与此同时，由于输出为m通道的特征图数量，为了映射到输出卷积层需要学习（k * k * n）* m个参数，但是…

卷积神经网络 2023年4月5日
000

合作推广

合作推广

返回顶部