Deep Learning 11_深度学习UFLDL教程：数据预处理（斯坦福大学深度学习教程）

2023年4月9日下午11:49 • 深度学习

理论知识：UFLDL数据预处理和http://www.cnblogs.com/tornadomeet/archive/2013/04/20/3033149.html

数据预处理是深度学习中非常重要的一步！如果说原始数据的获得，是深度学习中最重要的一步，那么获得原始数据之后对它的预处理更是重要的一部分。

1.数据预处理的方法：

①数据归一化：

简单缩放：对数据的每一个维度的值进行重新调节，使其在 $[0,1]或 [ - 1,1] 的区间内$

逐样本均值消减：在每个样本上减去数据的统计平均值，用于平稳的数据，对图像一般只用在灰度图上。

特征标准化：使数据的每一个维度具有零均值和单位方差。首先计算每一个维度上数据的均值（使用全体数据计算），之后在每一个维度上都减去该均值，然后在数据的每一维度上除以该维度上数据的标准差。最常用！

②白化：PCA白化、ZCA白化。重点是规则化项 epsilon的选择！

如果 epsilon 值过低，白化后的数据会显得噪声很大；相反，如果 epsilon 值过高，白化后的数据与原始数据相比就过于模糊。

epsilon的选择方法：

a.以图形方式画出数据的特征值；b.选取大于大多数较小的、反映数据中噪声的特征值作为 epsilon 。

2.具体怎么调节epsilon？没搞懂，要是有个Exercise就好了

2.预处理时，什么时候该进行逐样本均值消减（即：单独每个样本0均值化，而不是用所有样本每一维度0均值化）？

在数据的每个维度的统计性质是一样的时候。对于图像来说就是，对图像的照度并不感兴趣，而更多地关注其内容，这时对每个数据点移除像素的均值是有意义的，这时可以逐样本均值消减，它一般只适用于灰度图。

注意：彩色图像不能“逐样本均值消减”，它的归一化方法及原因见Deep Learning 九_深度学习UFLDL教程：linear decoder_exercise（斯坦福大学深度学习教程），即：“每一维0均值化”，进行预处理。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Deep Learning 11_深度学习UFLDL教程：数据预处理（斯坦福大学深度学习教程） - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

深度学习（dropout）

上一篇 2023年4月9日下午11:49

Deep Learning 10_深度学习UFLDL教程：Convolution and Pooling_exercise（斯坦福大学深度学习教程）

下一篇 2023年4月9日下午11:49

《神经网络和深度学习》系列文章十：[热身]一个基于矩阵的快速计算神经网络输出的方法

出处： Michael Nielsen的《Neural Network and Deep Learning》，点击末尾“阅读原文”即可查看英文原文。本节译者：哈工大SCIR硕士生李忠阳 (https://github.com/eecrazy) 声明：我们将在每周一，周四，周日定期连载该书的中文翻译，如需转载请联系wechat_editors@ir.h…

深度学习 2023年4月13日
000
笔记-吴恩达老师机器学习及深度学习

一、教程机器学习：https://www.coursera.org/course/ml 或者：http://open.163.com/special/opencourse/machinelearning.html 深度学习：https://mooc.study.163.com/university/deeplearning_ai#/c 二、…

深度学习 2023年4月12日
000
Torchkeras，一个源码不足300行的深度学习框架

Torchkeras 了解过深度学习框架的都知道，Tensorflow是早期的主流框架，而后又出现了Keras,keras对Tensorflow进行了封装，使得搭建深度学模型的过程简化到了几个简单的步骤：summary、compile、fit、evaluate、 predict。Pytorch虽然比Tensorflow出现的晚，但是其在框架的实现方式上，更为…

深度学习 2023年4月16日
000
吴恩达深度学习笔记（九） —— FaceNet

主要内容：一.FaceNet人脸识别简介二.使用神经网络对人脸进行编码三.代价函数triple loss 四.人脸库五.人脸认证与人脸识别一.FaceNet简介 1.FaceNet是一个深层神经网络，它将人脸编码成一个含有128个数的向量。通过比较两张人脸编码后的向量，可以判定两张人脸是否属于同一个人。 2.FaceNet的代价函数叫做…

深度学习 2023年4月13日
000
深度学习笔记目标函数的总结与整理 model.compile(loss=’categorical_crossentropy’,optimizer=sgd,metrics=[‘accuracy’])

keras model.compile(loss=’目标函数 ‘, optimizer=’adam’, metrics=[‘accuracy’]) 　　目标函数，或称损失函数，是网络中的性能函数，也是编译一个模型必须的两个参数之一。由于损失函数种类众多，下面以keras官网手册的为例。在官方keras.io里面，有如下资料： mean_squared_…

深度学习 2023年4月10日
000
吴恩达《深度学习》第三门课（2）机器学习策略二

2.1进行误差分析（1）一识别猫为案例，错误率为10%，这时系统还可以有较大提升空间，这时该往哪方面努力呢？可以通过误差分析，具体可以拿出100个分类错误的样本，然后利用表格统计每个样本分类错误的原因（如下图所示），比如很模糊，狗和猫很像，有滤镜等，一个样本出错可以同时有多个原因，统计看因为什么原因导致分类错误的比例最高，那么就应该着重花功夫在那上面。（…

深度学习 2023年4月11日
000
《神经网络和深度学习》系列文章六：通过梯度下降法学习参数

出处： Michael Nielsen的《Neural Network and Deep Learning》，点击末尾“阅读原文”即可查看英文原文。本节译者：哈工大SCIR本科生赵怀鹏 (https://github.com/zhaohuaipeng) 声明：我们将在每周一，周四，周日定期连载该书的中文翻译，如需转载请联系wechat_editors@i…

深度学习 2023年4月12日
000
深度学习

【深度学习大讲堂】首期第一讲：人工智能的ABCDE 第一部分：从人工智能和计算机视觉说起

（完）

2023年4月11日
000

合作推广

合作推广

返回顶部