深度学习之对抗样本问题

2023年4月13日上午12:20 • 深度学习

2006 年，Geoffrey Hinton 提出了深度学习。受益于大数据的出现和大规模计算能力的提升，深度学习已然成为最活跃的计算机研究领域之一。深度学习的多层非线性结构使其具备强大的特征表达能力和对复杂任务的建模能力。最近几年，深度学习的发展也带动了一系列的研究。尤其是在图像识别领域，在一些标准测试集上的试验表明，深度模型的识别能力已经可以达到人类的水平。但是，人们还是会产生一个疑问，对于一个非正常的输入，深度模型是否依然能够产生满意的结果。的确，最近有研究者开始关注深度模型抗干扰能力的研究，也就是关于深度学习对抗样本的问题。对于这一新的问题，本文对它进行一个简单的介绍。文章由黄立威、张天雷整理。

什么是深度学习对抗样本

Christian Szegedy等人在ICLR2014发表的论文中，他们提出了对抗样本（Adversarial examples）的概念，即在数据集中通过故意添加细微的干扰所形成的输入样本，受干扰之后的输入导致模型以高置信度给出一个错误的输出。在他们的论文中，他们发现包括卷积神经网络（Convolutional Neural Network, CNN）在内的深度学习模型对于对抗样本都具有极高的脆弱性。他们的研究提到，很多情况下，在训练集的不同子集上训练得到的具有不同结构的模型都会对相同的对抗样本实现误分，这意味着对抗样本成为了训练算法的一个盲点。Anh Nguyen等人在CVPR2015上发表的论文中，他们发现面对一些人类完全无法识别的样本（论文中称为Fooling Examples），可是深度学习模型会以高置信度将它们进行分类。这些研究的提出，迅速抓住了公众的注意力，有人将其当做是深度学习的深度缺陷，可是kdnuggets上的一篇文章(Deep Learning’s Deep Flaws)’s Deep Flaws指出，事实上深度学习对于对抗样本的脆弱性并不是深度学习所独有的，在很多的机器学习模型中普遍存在，因此进一步研究有利于抵抗对抗样本的算法实际上有利于整个机器学习领域的进步。

深度学习对于对抗样本表现的脆弱性产生的原因

是什么原因造成了深度学习对于对抗样本表现出脆弱性。一个推断性的解释是深度神经网络的高度非线性特征，以及纯粹的监督学习模型中不充分的模型平均和不充分的正则化所导致的过拟合。Ian Goodfellow 在ICLR2015年的论文中，通过在一个线性模型加入对抗干扰，发现只要线性模型的输入拥有足够的维度（事实上大部分情况下，模型输入的维度都比较大，因为维度过小的输入会导致模型的准确率过低），线性模型也对对抗样本表现出明显的脆弱性，这也驳斥了关于对抗样本是因为模型的高度非线性的解释。相反深度学习的对抗样本是由于模型的线性特征。

深度学习对抗样本泛化的原因

很多的时候，两个模型即使有不同的结构并在不同的训练集上被训练，一种模型的对抗样本在另一个模型中也同样会被误分，甚至它们还会将对抗样本误分为相同的类。这是因为对抗样本与模型的权值向量高度吻合，同时为了训练执行相同的任务，不同的模型学习了相似的函数。这种泛化特征意味着如果有人希望对模型进行恶意攻击，攻击者根本不必访问需要攻击的目标模型，就可以通过训练自己的模型来产生对抗样本，然后将这些对抗样本部署到他们需要攻击的模型中。

深度学习的对抗训练

所谓深度学习对抗训练，就是通过在对抗样本上训练模型。既然深度学习的对抗样本是由于模型的线性特征所导致，那就可以设计一种快速的方法来产生对抗样本进行对抗训练。Szegedy等人的研究认为对抗样本可以通过使用标准正则化技术解决，可是Goodfellow等人使用常见的正则化方法，如dropout, 预训练和模型平均进行测试，并没能显著地提高深度模型对于对抗样本的抗干扰能力。根据神经网络的Universal Approximation Theory，至少拥有一个隐层的神经网络只要拥有足够的隐层单元，就可以任意逼近任何一个非线性函数，这是浅层模型所不具备的。因此，对于解决对抗样本问题，Goodfellow等人认为深度学习至少有希望的，而浅层模型却不太可能。Goodfellow等人通过利用对抗样本训练，对抗样本上的误分率被大大降低。同时他们发现选择原始模型产生的对抗样本作为训练数据可以训练得到具有更高抵抗力的模型。此外，他们还发现，对于误分的对抗样本，对抗训练得到的模型的置信度依然很高。所以通过对抗训练能够提高深度学习的对于对抗样本的抗干扰能力。

几个深度学习对抗样本的事实

对于深度学习对抗样本，Ian Goodfellow认为目前存在一些误解，为了对这些误解进行进一步澄清，Kdnuggets网站的编辑邀请Goodfellow撰文Deep Learning Adversarial Examples – Clarifying Misconceptions。文章指出对抗样本在实际当中是经常可能出现的，而且在小的数据当中也能够经常被发现，例如试图骗过垃圾邮件检测系统的垃圾邮件。Goodfellow还指出识别一个对抗样本，然后拒绝对它进行分类并不是一个最佳的选择，通过有效的算法，能够克服数据干扰，正确识别对抗样本中的信息才是最终目的。此外，Goodfellow指出，人类并不会像现代机器学习算法那样被对抗样本所影响。如果我们的大脑会和机器学习模型一样犯同样的错误，那么由于对抗样本的在不同模型上的泛化属性，机器学习模型的对抗样本将会使我们产生视觉错乱。

总之，对抗样本是一个非常难的问题，研究如何克服它们可以帮助避免潜在的安全问题，并且帮助机器学习算法提高解决问题的准确性。某种意义上来说，设计一个易于训练的线性模型和设计一个能够抵御对抗干扰的非线性模型之间存在根本的矛盾，从长远来看，设计更强大的优化方法以训练更加非线性的模型是未来需要努力的方向。

感谢徐川对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作，请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博（@InfoQ，@丁晓昀），微信（微信号：InfoQChina）关注我们，并与我们的编辑和其他读者朋友交流（欢迎加入InfoQ读者交流群）。

【CNUTCon全球容器技术大会】阿里巴巴、百度、腾讯、360、京东、大众点评等国内知名互联网公司首次独家分享它们的Docker应用案例，RedHat副总裁、Kubernetes负责人、CoreOS负责人来华畅谈容器的未来，Docker、CoreOS、Mesos、Kubernetes等重磅级项目从0到1，专家教你怎么玩。了解详情。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习之对抗样本问题 - Python技术站

深度学习

0 0 打赏

微信扫一扫

支付宝扫一扫

深度学习与语义表示学习

上一篇 2023年4月12日

【转】贾扬清：希望Caffe成为深度学习领域的Hadoop

下一篇 2023年4月13日

深度学习

TensorRT基础笔记

TensorRT 是 NVIDIA 官方推出的基于 CUDA 和 cudnn 的高性能深度学习推理加速引擎，能够使深度学习模型在 GPU 上进行低延迟、高吞吐量的部署。采用 C++ 开发，并提供了 C++ 和 Python 的 API 接口，支持 TensorFlow、Pytorch、Caffe、Mxnet 等深度学习框架，其中 Mxnet、Pytorch …

2023年4月10日
000
NLP

自然语言处理神经网络模型入门概述

深度学习对自然语言处理领域产生了巨大影响。但是，作为初学者，您从哪里开始？深度学习和自然语言处理都是一个巨大的领域。每个领域需要关注的突出方面是什么，深度学习对NLP的哪些领域影响最大？在这篇文章中，您将发现有关自然语言处理深度学习相关的入门知识。阅读这篇文章后，您将知道：对自然语言处理领域影响最大的神经网络架构。可以通过深度学习成功解决的自然语…

2023年2月12日
000
【python深度学习】KS,KL,JS散度衡量两组数据是否同分布

目录 KS(不需要两组数据相同shape) JS散度（需要两组数据同shape）奇怪之处：有的地方也叫KL KS距离，相对熵，KS散度当P(x)和Q(x)的相似度越高，KS散度越小 KS散度主要有两个性质：（1）不对称性不对称性尽管KL散度从直观上是个度量或距离函数，但它并不是一个真正的度量或者距离，因为它不具有对称性，即D(P||Q)!=D(Q||…

深度学习 2023年4月13日
000
《动手学深度学习》系列笔记 —— 过拟合、欠拟合极其解决方案(权重衰减法、丢弃法)

1 训练误差和泛化误差训练误差（training error）：模型在训练数据集上表现出的误差。泛化误差（generalization error）：模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数，例如线性回归用到的平方损失函数和softmax回归用到的交叉熵损失函…

深度学习 2023年4月10日
000
深度学习笔记之关于特征（二）深度学习笔记之概述、背景和人脑视觉机理（一）

　　不多说，直接上干货！前期博客四、关于特征特征是机器学习系统的原材料，对最终模型的影响是毋庸置疑的。如果数据被很好的表达成了特征，通常线性模型就能达到满意的精度。那对于特征，我们需要考虑什么呢？　　4.1、特征表示的粒度学习算法在一个什么粒度上的特征表示，才有能发挥作用？…

深度学习 2023年4月13日
000
深度学习的本质

深度学习的本质是什么？它和神经网络是什么关系？它是一种新的机器学习模型吗？这些问题一直困惑着深度学习从业者们。在知乎上有“深度学习”和“多层神经网络”的区别?。从各种各样的回复中，我们再一次沦陷。那么，有没有权威人士对这些问题做一个负责的回答呢？有，从Andrew NG的Deep Learning课程中，我们可以看到Andrew的回答： “深度学习”这…

深度学习 2023年4月10日
000
深度学习

代码优化与程序加速指南——针对数值优化和深度学习领域

背景当需要处理规模较大、任务较复杂的优化问题或训练神经网络时，我们经常会遇到程序运行时间长或无法完成的情况。然而，这不一定是由于问题规模大或计算机硬件能力的限制。即使尝试使用更高性能的服务器或计算机，也不能保证能够有效地加速代码运行。因为高性能的硬件通常需要与为高性能计算而设计的代码相匹配。本文旨在为程序加速提供一些代码方面的优化思路，通过优化代码结构、…

2023年4月10日
000
深度学习

Ubuntu16.04搭建深度学习框架——TensorFlow

TensorFlow是一个采用数据流图（data flow graphs），用于数值计算的开源软件库,说白了，就是一个库。小编自己在Ubuntu搭建了深度学习框架TensorFlow，感觉挺简单，现在总结如下。 1.安装Anaconda 在ubuntu系统版本的Anaconda3已经集成了3.6版本的Python，安装步骤如下： a.下载Anoconda3…

2023年4月10日
000

深度学习之对抗样本问题

相关文章