《机器学习基石》—非线性变换

2023年4月12日下午11:01 • 机器学习

所谓非线性变换，就是把原始的特征做非线性变换，得到一个新的特征，使用这个新的特征来做线性的分类，则对应到原始的特征空间中，相当于做了非线性的分类。非线性变换的好处是，算法将有更多的选择，Ein可以做的更低。

例如使用二次变换：

《机器学习基石》---非线性变换

则Z空间中的一个直线分类边界，对应到原来空间中是一个二次曲线边界。可能是圆，椭圆，双曲线，抛物线，旋转后的椭圆，直线.......。

使用非线性变换进行学习的步骤如下：

《机器学习基石》---非线性变换

2 非线性变换的代价

Q次非线性变换如下定义：

《机器学习基石》---非线性变换

对应的Z空间的特征维度变为：

《机器学习基石》---非线性变换

特征维度的增加，一方面带来的是存储和计算的代价：

《机器学习基石》---非线性变换

更重要的另一个代价则是模型复杂度的代价。假设空间的VC维近似等于参数的个数：

《机器学习基石》---非线性变换

而更大的VC维将使得Ein和Eout相差很远这件事的概率增加。这是机器学习中一个重要的trade off：

《机器学习基石》---非线性变换

一种错误的认识是，通过观察数据来让Ein做的小，同时让VC维也小。例如：

《机器学习基石》---非线性变换

咋看之下，Ein降低了，VC维减小。Ein确实很低，但是VC维真的很低了吗？答案是否定的。产生这样错误认识的原因是我们没有很好的理解之前推导VCbound时“假设空间”这一概念。事实上，由于有人的观察帮忙，假设空间已经不再是我们让算法做选择的那个函数集，而是人在做选择时人脑中的假设空间。因此这里的VC维其实并不单单是我们让算法做选择的那个函数集VC维。

3 结构化假设空间

从0次到Q次的非线性变换，它们对应的假设空间范围是逐渐变大的，并且后一个包含了前一个：

《机器学习基石》---非线性变换

VC逐渐变大，Ein逐渐变小:

《机器学习基石》---非线性变换

因此一个实用的建议是，先尝试线性模型，如果Ein不够好再把模型复杂度慢慢往上加。一定不要一开始就用很复杂的非线性变换：

《机器学习基石》---非线性变换

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：《机器学习基石》—非线性变换 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

《机器学习基石》—过拟合风险

上一篇 2023年4月12日

《机器学习基石》—线性回归

下一篇 2023年4月12日

目标检测

3D目标检测（CVPR2020：Lidar）

3D目标检测（CVPR2020：Lidar） LiDAR-Based Online 3D Video Object Detection With Graph-Based Message Passing and Spatiotemporal Transformer Attention 论文地址： http://openaccess.thecvf.com/con…

2023年4月8日
000
目标检测

hough forest目标检测原理

霍夫森林是随机森林和霍夫投票在计算机视觉中的应用，可以用在物体检测，跟踪和动作识别。 09年cvpr上提出霍夫森林的文章——Class-Specific Hough Forests for Object Detection 关于hough变换，请看我之前的一篇博客Hough直线检测关于随机森林，请看我的另一篇博客Random Forest随机森林算法下…

2023年4月7日
000
Caffe

caffe添加自己的层

首先修改src/caffe/proto/下的caffe.proto,修改好后需要编译然后修改include/caffe/layers/logwxl_layer.hpp 然后修改src/caffe/layers/logwxl_layer.cpp和logwxl_layer.cu 最后make all ,make test ,make runt…

2023年4月8日
000
Caffe

Caffe学习记录(十) SegNet等分割网络学习

图像分割作为计算机视觉的一个方向，广泛应用在各个领域，记录一下学习的过程，以及各个网络的优缺点，不同的地方等。最流行的方法是FCN，整个分割的流程大致可以看做如下： FCN顾名思义，全卷机网络，就是把fc层都换做1×1的卷积层，channel等价于fc层的输出个数。 FCN的架构为编码器，和解码器组成，编码器阶段为卷积+池化的下采样过程，解码器阶段为卷…

2023年4月8日
000
编译caffe-gpu-cuda及cudnn-tar 下载地址

y下载 https://github.com/BVLC/caffe https://github.com/BVLC/caffe/archive/master.zip gcc　　 caffe安装有2个问题：1，镜像系统类型，版本要求2，是否使用cudnn(gpu) caffe要调用cudnn部分文件编译 (如用，cuda cudnn版本要求) ubuntu…

Caffe 2023年4月7日
000
PyTorch

PyTorch如何构建深度学习模型？

简介每过一段时间，就会有一个深度学习库被开发，这些深度学习库往往可以改变深度学习领域的景观。Pytorch就是这样一个库。在过去的一段时间里，我研究了Pytorch，我惊叹于它的操作简易。Pytorch是我迄今为止所使用的深度学习库中最灵活的，最轻松的。在本文中，我们将以实践的方式来探索Pytorch，包括基础知识与案例研究。我们会使用numpy和Py…

2023年4月8日
000
目标检测

基于视频的目标检测

一. 提出背景目标检测在图像处理领域有着非常大的占比，过去两年，深度学习在Detection的持续发力，为这个领域带来了变革式的发展：一方面，从 RCNN 到 Fast RCNN，再到Faster RCNN，不断刷新 mAP；另一方面，SSD、YOLO 则是将性能提高到一个非常高的帧率。对于视频来讲，相邻帧目标之间存在明显的…

2023年4月8日
000
目标检测

[目标检测]PVAnet原理

创新点：基于Faster-RCNN使用更高效的基础网络 1.1 创新点 PVAnet是RCNN系列目标方向，基于Faster-RCNN进行改进，Faster-RCNN基础网络可以使用ZF、VGG、Resnet等，但精度与速度难以同时提高。PVAnet的含义应该为：Performance Vs Accuracy，意为加速模型性能，同时不丢失精度的含义。主要的工…

2023年4月8日
000

合作推广

合作推广

返回顶部