什么是深度学习?深度学习入门!

什么是深度学习

在本文中,我们将讨论什么是深度学习,这是当前业内非常热门的话题,并且深度学习在人工智能、大数据和大数据分析等领域的众多行业中得到非常广泛的应用。例如,谷歌在语音、图像识别算法中就使用深度学习, Netflix 和亚马逊也使用它来了解客户的行为。

也许你不会相信,但美国麻省理工学院的一些研究人员正在尝试使用深度学习来预测未来。深度学习拥有改变世界的潜力!

在本文谈论深度学习之前,必须了解它与机器学习和人工智能的关系。理解这种关系的最简单方法是通过下图:

什么是深度学习——人工智能技术时间表

在图像中你可以看到,机器学习是人工智能的一个子集。机器学习意味着我们可以创造出根据已有的数据集进行自行学习的智能机器。

而深度学习又是机器学习的一个子集。深度学习使用类似的机器学习算法来训练深度神经网络,相对于机器学习,深度学习可以实现更高的准确性。以下是本教程的主题内容:

  • 人工智能
  • 机器学习
  • 机器学习的缺点
  • 什么是深度学习?
  • 深度学习应用

人工智能

什么是深度学习——人工智能

人工智能一词由约翰麦卡锡于 1956 年创造,他也被称为人工智能之父。人工智能背后的想法相当简单但引人入胜,那就是制造可以自行做出决定的智能机器。你可能认为它是一个科学幻想,但考虑到最近科技和计算能力的发展,这个想法似乎正日益接近现实。

机器学习:迈向人工智能的一步

现在,您已经了解了人工智能,让我们简要地谈谈机器学习,并理解当我们对机器进行编程以让机器进行学习的含义。

让我们从机器学习的一个非常著名的定义开始:

“如果计算机程序在 T 上的性能(由 P 衡量)随着经验 E 的提高而提高,则可以说计算机程序从经验 E 中学习关于某些任务 T 和某些性能指标 P。” — 汤姆·米切尔,卡内基梅隆大学

这句话的意思是,如果您想写个预测繁忙十字路口的交通模式的程序(任务 T),您可以使用有关过去交通模式的数据(经验 E)通过机器学习算法运行它。现在,预测的准确性(性能指标 P)将取决于程序是否成功地从数据集中学习(经验 E)这一事实。

机器学习被称为一种人工智能 (AI),它为计算机提供学习能力。机器学习背后的核心原则是从数据集中学习并尝试最小化错误或最大化其预测为真的可能性。

机器学习的缺点

什么是深度学习?深度学习入门!

  • 传统的 ML 算法在处理高维数据时没有用,因为高维数据需要大量的训练数据集。例如,在识别手写这个任务中,需要提供给机器学习大量的训练数据作为输入,并且这些手写文字需要各种不同的类型,以便机器学习能够识别更大的范围。

  • 第二个主要挑战是需要告诉计算机它应该寻找哪些特征,这些特征将在预测结果中发挥重要作用,并在这样做时获得更高的准确性。这个过程被称为 特征提取,这是依赖于人工的十分复杂的过程。

直接将原始数据输入算法并不奏效,所以特征提取在传统机器学习工作流程中十分关键。如果没有特征提取,程序员面临的挑战会增加,因为算法的有效性在很大程度上取决于程序员的洞察力。因此,很难将这些机器学习模型或算法应用于对象识别、手写识别、NLP(自然语言处理)等复杂问题。

深度学习

深度学习是我们克服特征提取挑战的方法之一。这是因为深度学习模型能够自行学习,并提取出正确的特征,这个过程几乎不需要程序员的干预。

这是因为深度学习模仿了我们大脑的运作方式,即从经验中学习。我们的大脑由数十亿个神经元组成,这些神经元使我们能够做出十分惊人的事情。即使是一岁孩子的大脑也能解决使用超级计算机也很难解决的复杂问题。例如:

  • 认出他们父母的脸和不同的物体。
  • 区分不同的声音,甚至可以根据他/她的声音识别特定的人。
  • 从其他人的面部表情、肢体语言等进行推断。

事实上,从出生开始,我们的大脑就已经下意识地训练自己做这样的事情。那么问题来了,深度学习如何模仿大脑的功能?

如上文所述,深度学习使用的是人工神经元的概念,它的功能与我们大脑中存在的生物神经元类似。因此,我们可以说深度学习是机器学习的一个子领域,主要使用受大脑结构和功能启发的算法,其称为人工神经网络。

现在,让我们举个例子来理解人工神经网络。假设我们想要制作一个系统,可以识别图片中不同人的面孔。如果我们使用传统的机器学习来解决,我们要人工定义眼睛、鼻子、耳朵等面部特征,然后让系统自行识别哪个人对应了哪些面部特征。

而深度学习向前推进了一步。通过深度神经网络,深度学习会自动找出对分类很重要的特征,这解决了在机器学习中我们必须手动定义这些特征的问题。

使用深度网络的人脸识别

如上图所示,深度学习的工作原理如下:

  • 在最低级别,计算机将专注于局部对比模式。
  • 然后下一层能够使用这些局部对比模式来区分出类似于眼睛、鼻子和嘴巴的事物。
  • 最后,顶层能够将这些面部特征应用于面部模板。
  • 深度神经网络能够在其每个连续层中组成越来越复杂的特征。

你有没有想过苹果图库如何自动标记或标记你上传的图像中出现的所有人?其实苹果图库的人脸识别模式就与以上例子的识别过程类似。

现在,您应该已经明白了深度学习的原理,以及深度学习是如何超越机器学习的。

简要来说,深度网络可以从没有适当标记的输入数据集中进行自我推断,克服了机器学习的缺点。

深度学习的应用

让我们接着往下看,看看深度学习的一些实际应用,以了解它真正的力量。

语音识别

大家都听说过 Siri,它是苹果手机的语音控制智能助手。与其他巨头一样,苹果手机也开始投资深度学习,以使其服务比以往任何时候都更好。

什么是深度学习?深度学习入门!

在语音识别和Siri等语音控制智能助手领域,利用深度神经网络可以开发出更精确的声学模型,这是目前深度学习应用最为活跃的领域之一。简而言之,您可以构建这样的系统,该系统可以学习新功能或根据您的需要进行自我调整,从而通过预先预测出所有可能性,来为客户提供更好的帮助。

机器自动翻译

什么是深度学习?深度学习入门!

我们都知道谷歌可以在 100 种不同的人类语言之间即时翻译,这速度太快了,就像变魔术一样。谷歌翻译背后的技术称为机器翻译,并成为了因语言差异而无法相互交流的人们的救星。

您可能会认为此功能已经存在很长时间了,这又有什么可说的呢?事实上,在过去的两年里,在深度学习的帮助下,谷歌在其谷歌翻译中彻底改革了机器翻译的方法,对语言翻译几乎一无所知的深度学习研究人员正在提出相对简单的机器学习解决方案,这些解决方案正在击败世界上最好的专家构建的语言翻译系统。它无需对序列进行任何预处理即可执行文本翻译,从而使算法能够了解单词之间的依赖关系及其与新语言的映射。

即时视觉翻译

什么是深度学习?深度学习入门!

您应该也有所了解,深度学习可以用于识别包含文字的图像,并能识别出文字在图像中的位置。一旦被识别,它们就可以将其转换成文本,并进行翻译,然后用翻译后的文本重新创建图像。这通常称为即时视觉翻译。

想象这样一个场景,您到达母语不为您所知的其他国家时,您不用担心,只要使用谷歌翻译等各种应用程序,您就可以通过即时视觉翻译系统,阅读用另一种语言编写的标志或商店牌匾。只有深度学习才有可能做到这一点。

自动驾驶汽车

谷歌正尝试使用深度学习将他们的自动驾驶汽车计划 WAYMO 提升到一个全新的完美水平。与其使用旧的手工编码算法相比,他们现在可以编写可以使用不同传感器提供的数据自行学习的系统。深度学习现在是大多数感知任务以及许多低级控制任务的最佳方法。在未来,即使是不会开车或行动不便的人,也可以在不依赖任何人的情况下乘坐汽车。

什么是深度学习?深度学习入门!

本文中只提到了几个比较典型的现实生活应用,其中深度学习被广泛使用并显示出不错的成果。深度学习还有许多其他应用以及许多有待探索的领域。

这就是深度学习。相信到目前为止,您已经了解到了机器学习和深度学习之间的区别,以及深度学习在现实生活中的一些应用。在下一篇博客中,我们将深入探讨深度学习的各种概念和算法及其应用细节。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:什么是深度学习?深度学习入门! - Python技术站

(0)
上一篇 2022年11月10日 下午2:03
下一篇 2022年12月6日 下午8:35

相关文章

  • 深度学习读书笔记之RBM(限制波尔兹曼机)

    声明: 1)看到其他博客如@zouxy09都有个声明,老衲也抄袭一下这个东西 2)该博文是整理自网上很大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。 3)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并…

    深度学习 2023年4月13日
    00
  • 时尚与深度学习系列:Fashion forward: Forecasting visual style in fashion

           https://arxiv.org/pdf/1705.06394.pdf         将深度学习与时尚预测联系在一起,是一个很有趣但是估计结果会没什么成效的话题。因为,时尚预测这一领域,与股票金融房价之类的预测不一样,不是一个结合街区环境,经济环境,天气等客观情况就能预测综合走向的,而是依据某些fashion icon的主观性,时尚编辑的意…

    2023年4月9日
    00
  • 深度学习扫盲笔记

    第一章:概述 深度学习:机器学习含有多个隐藏层 有监督的:卷积,循环,递归 无监督的:生成式 类别标签: ground truth:表示直接收集到的数据 使用sklearn进行训练集,测试集的拆分:留出法和k折交叉验证,分层抽样策略 超参数:不变的,调节超参数找到能使模型取得较好性能的超参数 第二章:特征工程 目的是最大限度地从原始数据中提取特征以供算法和模…

    2023年4月9日
    00
  • 【神经网络与深度学习】Win10+VS2015 caffe环境搭建(极其详细)

    caffe是好用,可是配置其环境实在是太痛苦了,依赖的库很多不说,在VS上编译还各种报错,你能想象那种被一百多个红色提示所笼罩的恐惧。 且网上很多教程是VS2013环境下编译的,问人很多也说让我把15卸载了装13,我的答案是:偏不 记下这个艰难的过程,万一还要再来一次呢…… Attention: 本文使用的caffe windows环境配置为: VS2015…

    深度学习 2023年4月13日
    00
  • 【神经网络与深度学习】Caffe训练执行时爆出的Check failed: registry.count(t ype) == 1 (0 vs. 1) Unknown layer type

     自己建立一个工程,希望调用libcaffe.lib ,各种配置好,也能成功编译,但是运行就会遇到报错 F0519 14:54:12.494139 14504 layer_factory.hpp:77] Check failed: registry.count(t ype) == 1 (0 vs. 1) Unknown layer type: Input (…

    深度学习 2023年4月13日
    00
  • 深度学习6一般线性模型

    在前面我们曾经有一个问题,就是在logistic回归中,我们为什么用 对于这个问题,我们先定义了一个一般线性模型 一般为y,就是我们前面所说的真实值y 这个分布也就是指数分布 伯努利分布,高斯分布,泊松分布,贝塔分布,狄特里特分布都可以用这个指数分布来表示。 在对数回归时采用的是伯努利分布,对于伯努利分布,可以表示成 则我们对照上面的一般线性模型 解,这边也…

    深度学习 2023年4月11日
    00
  • 文章预告的自我挖坑系列——时尚与深度学习

    开这一系列的坑是我一直以来都想做的事情,纯属个人兴趣吧。 看到过不少论文是将时尚产业(也就是服饰之类的)与深度学习相结合,所以开写一个此类文献学习的总结的小坑,如果后期实现了什么的,也会一起写上。 null

    深度学习 2023年4月9日
    00
  • Deep Learning 10_深度学习UFLDL教程:Convolution and Pooling_exercise(斯坦福大学深度学习教程)

    前言 理论知识:UFLDL教程和http://www.cnblogs.com/tornadomeet/archive/2013/04/09/3009830.html 实验环境:win7, matlab2015b,16G内存,2T机械硬盘 实验内容:Exercise:Convolution and Pooling。从2000张64*64的RGB图片(它是 th…

    2023年4月9日
    00
合作推广
合作推广
分享本页
返回顶部