什么是深度学习？深度学习入门！

什么是深度学习？

在本文中，我们将讨论什么是深度学习，这是当前业内非常热门的话题，并且深度学习在人工智能、大数据和大数据分析等领域的众多行业中得到非常广泛的应用。例如，谷歌在语音、图像识别算法中就使用深度学习， Netflix 和亚马逊也使用它来了解客户的行为。

也许你不会相信，但美国麻省理工学院的一些研究人员正在尝试使用深度学习来预测未来。深度学习拥有改变世界的潜力！

在本文谈论深度学习之前，必须了解它与机器学习和人工智能的关系。理解这种关系的最简单方法是通过下图：

在图像中你可以看到，机器学习是人工智能的一个子集。机器学习意味着我们可以创造出根据已有的数据集进行自行学习的智能机器。

而深度学习又是机器学习的一个子集。深度学习使用类似的机器学习算法来训练深度神经网络，相对于机器学习，深度学习可以实现更高的准确性。以下是本教程的主题内容：

人工智能
机器学习
机器学习的缺点
什么是深度学习？
深度学习应用

人工智能

人工智能一词由约翰麦卡锡于 1956 年创造，他也被称为人工智能之父。人工智能背后的想法相当简单但引人入胜，那就是制造可以自行做出决定的智能机器。你可能认为它是一个科学幻想，但考虑到最近科技和计算能力的发展，这个想法似乎正日益接近现实。

机器学习：迈向人工智能的一步

现在，您已经了解了人工智能，让我们简要地谈谈机器学习，并理解当我们对机器进行编程以让机器进行学习的含义。

让我们从机器学习的一个非常著名的定义开始：

“如果计算机程序在 T 上的性能（由 P 衡量）随着经验 E 的提高而提高，则可以说计算机程序从经验 E 中学习关于某些任务 T 和某些性能指标 P。” — 汤姆·米切尔，卡内基梅隆大学

这句话的意思是，如果您想写个预测繁忙十字路口的交通模式的程序（任务 T），您可以使用有关过去交通模式的数据（经验 E）通过机器学习算法运行它。现在，预测的准确性（性能指标 P）将取决于程序是否成功地从数据集中学习（经验 E）这一事实。

机器学习被称为一种人工智能 (AI)，它为计算机提供学习能力。机器学习背后的核心原则是从数据集中学习并尝试最小化错误或最大化其预测为真的可能性。

机器学习的缺点

传统的 ML 算法在处理高维数据时没有用，因为高维数据需要大量的训练数据集。例如，在识别手写这个任务中，需要提供给机器学习大量的训练数据作为输入，并且这些手写文字需要各种不同的类型，以便机器学习能够识别更大的范围。
第二个主要挑战是需要告诉计算机它应该寻找哪些特征，这些特征将在预测结果中发挥重要作用，并在这样做时获得更高的准确性。这个过程被称为 特征提取，这是依赖于人工的十分复杂的过程。

直接将原始数据输入算法并不奏效，所以特征提取在传统机器学习工作流程中十分关键。如果没有特征提取，程序员面临的挑战会增加，因为算法的有效性在很大程度上取决于程序员的洞察力。因此，很难将这些机器学习模型或算法应用于对象识别、手写识别、NLP（自然语言处理）等复杂问题。

深度学习

深度学习是我们克服特征提取挑战的方法之一。这是因为深度学习模型能够自行学习，并提取出正确的特征，这个过程几乎不需要程序员的干预。

这是因为深度学习模仿了我们大脑的运作方式，即从经验中学习。我们的大脑由数十亿个神经元组成，这些神经元使我们能够做出十分惊人的事情。即使是一岁孩子的大脑也能解决使用超级计算机也很难解决的复杂问题。例如：

认出他们父母的脸和不同的物体。
区分不同的声音，甚至可以根据他/她的声音识别特定的人。
从其他人的面部表情、肢体语言等进行推断。

事实上，从出生开始，我们的大脑就已经下意识地训练自己做这样的事情。那么问题来了，深度学习如何模仿大脑的功能？

如上文所述，深度学习使用的是人工神经元的概念，它的功能与我们大脑中存在的生物神经元类似。因此，我们可以说深度学习是机器学习的一个子领域，主要使用受大脑结构和功能启发的算法，其称为人工神经网络。

现在，让我们举个例子来理解人工神经网络。假设我们想要制作一个系统，可以识别图片中不同人的面孔。如果我们使用传统的机器学习来解决，我们要人工定义眼睛、鼻子、耳朵等面部特征，然后让系统自行识别哪个人对应了哪些面部特征。

而深度学习向前推进了一步。通过深度神经网络，深度学习会自动找出对分类很重要的特征，这解决了在机器学习中我们必须手动定义这些特征的问题。

如上图所示，深度学习的工作原理如下：

在最低级别，计算机将专注于局部对比模式。
然后下一层能够使用这些局部对比模式来区分出类似于眼睛、鼻子和嘴巴的事物。
最后，顶层能够将这些面部特征应用于面部模板。
深度神经网络能够在其每个连续层中组成越来越复杂的特征。

你有没有想过苹果图库如何自动标记或标记你上传的图像中出现的所有人？其实苹果图库的人脸识别模式就与以上例子的识别过程类似。

现在，您应该已经明白了深度学习的原理，以及深度学习是如何超越机器学习的。

简要来说，深度网络可以从没有适当标记的输入数据集中进行自我推断，克服了机器学习的缺点。

深度学习的应用

让我们接着往下看，看看深度学习的一些实际应用，以了解它真正的力量。

语音识别

大家都听说过 Siri，它是苹果手机的语音控制智能助手。与其他巨头一样，苹果手机也开始投资深度学习，以使其服务比以往任何时候都更好。

在语音识别和Siri等语音控制智能助手领域，利用深度神经网络可以开发出更精确的声学模型，这是目前深度学习应用最为活跃的领域之一。简而言之，您可以构建这样的系统，该系统可以学习新功能或根据您的需要进行自我调整，从而通过预先预测出所有可能性，来为客户提供更好的帮助。

机器自动翻译

我们都知道谷歌可以在 100 种不同的人类语言之间即时翻译，这速度太快了，就像变魔术一样。谷歌翻译背后的技术称为机器翻译，并成为了因语言差异而无法相互交流的人们的救星。

您可能会认为此功能已经存在很长时间了，这又有什么可说的呢？事实上，在过去的两年里，在深度学习的帮助下，谷歌在其谷歌翻译中彻底改革了机器翻译的方法，对语言翻译几乎一无所知的深度学习研究人员正在提出相对简单的机器学习解决方案，这些解决方案正在击败世界上最好的专家构建的语言翻译系统。它无需对序列进行任何预处理即可执行文本翻译，从而使算法能够了解单词之间的依赖关系及其与新语言的映射。

即时视觉翻译

您应该也有所了解，深度学习可以用于识别包含文字的图像，并能识别出文字在图像中的位置。一旦被识别，它们就可以将其转换成文本，并进行翻译，然后用翻译后的文本重新创建图像。这通常称为即时视觉翻译。

想象这样一个场景，您到达母语不为您所知的其他国家时，您不用担心，只要使用谷歌翻译等各种应用程序，您就可以通过即时视觉翻译系统，阅读用另一种语言编写的标志或商店牌匾。只有深度学习才有可能做到这一点。

自动驾驶汽车

谷歌正尝试使用深度学习将他们的自动驾驶汽车计划 WAYMO 提升到一个全新的完美水平。与其使用旧的手工编码算法相比，他们现在可以编写可以使用不同传感器提供的数据自行学习的系统。深度学习现在是大多数感知任务以及许多低级控制任务的最佳方法。在未来，即使是不会开车或行动不便的人，也可以在不依赖任何人的情况下乘坐汽车。