在人工智能的早期,那些对人类智力来说非常困难、但对计算机来说相对简单的问题得到迅速解决,比如,那些可以通过一系列形式化的数学规则来描述的问题。人工智能真正的挑战在于解决那些对人来说很容易执行、但很难形式化描述的任务,如识别人们所说的话或图像中的脸。对于这些问题,我们人类往往可以凭借直觉简易地解决。

抽象和形式化的任务对人类而言是最困难的脑力任务之一,但对计算机而言却属于最容易的。计算机早就能够打败人类最好的国际象棋选手,但直到最近计算机在识别对象或语音任务中达到人类平均水平。一个人的日常生活需要关于世界的巨量知识。很多这方面的知识是主观的、直观的,因此很难通过形式化的方式表达清楚。计算机需要获取同样的知识才能表现出只能。人工只能的一个关键挑战就是如何将这些非形式化的知识传达给计算机。

一些人工只能项目力求将关于世界的知识用形式化的语言进行硬编码。计算机可以使用逻辑推理规则来自动地理解这些形式化语言中的声明。这就是众所周知的人工智能的知识库方法。但这种方式并没有取得很明显的效果,或巨大的成就。就像之前说的那样,这只能解决一些抽象的形式化的问题。

AI系统需要具备自己获取知识的能力,即从原始数据中提取模式的能力。这种能力称为机器学习。引入机器学习是计算机能够解决涉及世界知识的问题,并能做出看似主观的决策。

就像数学中的函数一样,知识库就好比一般的显函数y = ax1 + bx2 + c,这种输入为x1、x2,输出为y这种输入和输出之间有明确关系的。而我们要解决的就是那些输入与输出之间没有明确关系式的问题,而这些问题我们有的只有一堆数据(输入和与之相对应的输出)。而机器学习就是要找到输入与输出之间的关系,可能这种关系是不能用什么关系式表达出来的那种。

简单的机器学习算法的性能在很大成都上依赖于给定数据的表示。例如,当逻辑回归用于判断产妇是否适合剖腹产时,AI系统不会直接检查患者。相反,医生需要告诉系统几天相关的信息,诸如是否存在子宫疤痕。表示患者的每条信息成为一个特征。许多人工智能都是先提取一个合适的特征集,然后将这些特征提供给简单的机器学习算法。然而,对于许多任务来说,我们很难知道应该提取那些特征。而解决这个问题的途径之一就是用机器学习自己来发掘表示本身。

深度学习是解决这些问题的一个途径。深度学习通过其他简单的表示来表达复杂表示,解决了表示学习中的核心问题。深度学习通过其他较简单的表示来表达复杂表示,解决了表示学习中的核心问题。下图展示了深度学习如何通过组合较简单的概念(例如角和轮廓,他们反过来有边线定义)来表示图像中人的概念。

深度学习概述

计算机难以立决原始感观输入数据的含义,如表示为像素值集合的图像。将一组图像映射到对象表示的函数非常复杂。如果直接处理,学习或评估此映射似乎是不可能的。深度学习将所需的复杂映射分解为一系列嵌套的简单映射来解决这一难题。输入展示在卡可见层,这样命名的原因是因为它包含我们能观察到的变量。然后是一系列从图像中提取越来越多抽象特征的隐藏层。因为他们呢的值在不在数据中给出,所以将这些层成为“隐藏层”;模型必须确定那些概念有利于解释观察数据中的关系。第1层可以轻易地通过比较相邻像素的亮度来识别边缘。有了第一层隐藏描述的边缘,第2隐藏层可以容易地搜错可识别为角和扩展轮廓的边集合。给定第2隐藏层中关于角和轮廓的图像描述,第3隐藏层可以找到轮廓和角的特定集合来检测特定集合来检测特定对象的整个部分。最后,根据图像描述中包含的对象部分,可以识别图像中存在的对象。

下图展示了AI系统的不同部分如何在不同的AI学科中彼此相关。阴影狂表示能从数据中学习的组件

深度学习概述