出现背景(why?)

在分类任务中,训练机器学习和深度学习模块需要大量的真实世界数据,并且在某些情况下,获取足够数量的真实数据存在局限性,或者仅仅是时间和人力资源的投入也可能会受到限制。

概念

GAN于2014年提出并在最近几年变得越来越活跃,主要用于数据扩充,以解决如何通过隐含生成模型来生成人造自然外观样本以模拟真实世界数据的问题,从而可以增加未公开的训练数据样本数量[122]。

K. G. Hartmann, R. T. Schirrmeister, and T. Ball, “Eeg-gan: Generative adversarial networks for electroencephalograhic (eeg) brain signals,” arXiv preprint arXiv:1806.01875, 2018.

GAN包括两个同步训练的神经网络,即生成器网络鉴别器网络,如图7所示。

深度学习~生成式对抗神经网络GAN

 

  • 生成器网络可以捕获输入数据分布并旨在生成伪造的样本数据,
  • 鉴别器网络可以区分样本是否来自真实的训练数据。

这两个神经网络旨在从经过预训练的生成器生成样本集合,并将样本用于其他功能(例如分类)。