深度学习导论 – 读李宏毅《1天搞懂深度学习》

2023年4月11日上午2:42 • 深度学习

yizhihongxing

先引用他人关于李宏毅教授关于深度学习导论的PPT，应该非常容易入门。

”《1天搞懂深度学习》，300多页的ppt，台湾李宏毅教授写的，非常棒。不夸张地说，是我看过最系统，也最通俗易懂的，关于深度学习的文章。“

这是slideshare的链接：
http://www.slideshare.net/tw_dsconf/ss-62245351?qid=108adce3-2c3d-4758-a830-95d0a57e46bc&v=&b=&from_search=3

没梯子的同学，可以从我的网盘下：
链接：http://pan.baidu.com/s/1nv54p9R 密码：3mty

废话少说，先上干货，整个PPT的思维导图如下：

深度学习导论 - 读李宏毅《1天搞懂深度学习》

深度学习概论

介绍深度学习

作者非常浅显的指出机器（深度）学习过程非常简单，分为定义方法、判断方法的优劣、挑选出最佳的方法。

深度学习导论 - 读李宏毅《1天搞懂深度学习》

对于深度学习，首先第一步定义方法 - 神经网络。深度学习顾名思义是指多层的神经网络。

神经网络的思想来源于对于人脑的生理上的研究，人脑由数亿个神经元组成，神经元通过轴突互相连接通信。神经网络和人脑类似，存在多个层级（layer），每个层级都有多个节点（神经元），层级和层级之间相互连接（轴突），最终输出结果。

对于神经网络的计算能力可以理解为通过一层层Layer的计算归纳，逐步的将抽象的原始数据变的具体。以图片识别为例，输入是一个个像素点，经过每层神经网络，逐步变化成为线、面、对象的概念，然后机器有能力能够识别出来。

深度学习导论 - 读李宏毅《1天搞懂深度学习》

第二步，评估方法的优劣。

Loss function是用于评估方法优劣，通常我们用学习出来的参数对测试数据进行计算，得出对应的预测（y）然后和真实的测试数据的目标值（t）进行比对，y和t之间的差距往往就是Loss。那么评估一个算法的好坏，就是要尽可能的降低Loss。

深度学习导论 - 读李宏毅《1天搞懂深度学习》

第三步，如何获得最佳的学习方法

获得最佳的学习是采用梯度下降算法，作者也提到梯度下降算法存在局部最优解的问题。人们往往认为机器无所不能，实际上更像是在一个地图上面拓荒，对周边一无所知。神经网络计算梯度的算法是反向传播算法，简称BP。

深度学习导论 - 读李宏毅《1天搞懂深度学习》

Why Deep？

作者首先指出越多的参数往往带来越好的预测能力，所以神经网络往往参数越多越好。那么如果是同样的参数情况下，为什么层级较多的表现会更好呢？

深度学习导论 - 读李宏毅《1天搞懂深度学习》

作者认为深度网络可以带来模块化的好处，随着网络的层级，神经网络会将像素元素逐渐归纳出一些基本的特征，进而变成纹理，进而变成对象。

深度学习导论 - 读李宏毅《1天搞懂深度学习》

训练方法

深度学习导论 - 读李宏毅《1天搞懂深度学习》

作者总结下来训练过程中会发现了两种情况：

1. 没有办法得到很好的训练结果 ---》重新选择训练方式

2. 没有办法得到很好的测试结果 ---》往往由于过度拟合导致，需要重新定义方法

深度学习导论 - 读李宏毅《1天搞懂深度学习》

优化训练方法的手段：

1. 选择合适的Loss function：使用Cross Entropy效果要优于Mean Square Error

2. Mini-batch: 每次训练使用少量数据而不是全量数据效率更高

3. Activation Function：使用ReLU替代Sigmoid可以解决梯度消失的问题，可以训练更深的神经网络

4. Adaptive Learning Rate：可以随着迭代不断自我调整，提高学习效率

5. Momentum: 可以一定程度上避免陷入局部最低点的问题

深度学习导论 - 读李宏毅《1天搞懂深度学习》

避免过度拟合（overfitting）的方法：

1. Early Stopping：使用cross validation的方式，不断对validation data进行检验，一旦发现预测精度下降则停止。

2. Weight Decay：参数正则化的一种方式？

3. Dropout：通过随机去掉一些节点的连接达到改变网络形式，所以会产生出多种网络形态，然后汇集得到一个最佳结果

4. Network Structure: 例如CNN等其他形态的网络

神经网络变体

Convolutional Neural Network (CNN)

深度学习导论 - 读李宏毅《1天搞懂深度学习》

通常情况下，一个CNN包含多次的卷积、池化，然后Flatten，最终再通过一个深度神经网络进行学习预测。CNN在图像、语音识别取得非常好的成绩，核心的想法在于一些物体的特征往往可以提取出来，并且可能出现在图片的任何位置，而且通过卷积、池化可以大大减少输入数据，加快训练效率。

Recurrent Neural Network (RNN)

深度学习导论 - 读李宏毅《1天搞懂深度学习》

RNN的想法是可以将hidden layer的数据存储下来，然后作为输入给下一个网络学习。这种网络的想法可以解决自然语言中前后词语是存在关联性的，所以RNN可以把这些关联性放到网络中进行学习。

其他前沿技术

Ultra Deep Network：2015年出现了152层的Residual Net实现了图片3.57%错误率

深度学习导论 - 读李宏毅《1天搞懂深度学习》

Reinforcement Learning: 通过奖励机制强化学习，并且做出相应的动作

深度学习导论 - 读李宏毅《1天搞懂深度学习》

Unsupervised Learning:

1. Deep Style

深度学习导论 - 读李宏毅《1天搞懂深度学习》

2. 生成图片

深度学习导论 - 读李宏毅《1天搞懂深度学习》

3. 无需人工介入理解文字的含义

深度学习导论 - 读李宏毅《1天搞懂深度学习》

有兴趣同学可以关注微信公众号奶爸码农，不定期分享投资理财、IT相关内容：

深度学习导论 - 读李宏毅《1天搞懂深度学习》

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习导论 – 读李宏毅《1天搞懂深度学习》 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

深度学习实践系列（2）- 搭建notMNIST的深度神经网络

上一篇 2023年4月11日

深度学习实践系列（1）- 从零搭建notMNIST逻辑回归模型

下一篇 2023年4月11日

深度学习的encoder和decoder

所谓编码，就是将输入序列转化成一个固定长度的向量；解码，就是将之前生成的固定向量再转化成输出序列。

深度学习 2023年4月12日
000
深度学习 vs SLAM

第三部分：深度学习 vs SLAM SLAM 小组讨论真是乐趣无穷。在我们进入重要的「深度学习 vs SLAM」讨论之前，我应该说明每一位研讨会展示者都同意：语义对构建更大更好的 SLAM 系统是必需的。关于未来的方向，这里有很多有趣的小对话。在争论中，Marc Pollefeys（一位知名的 SfM 和多视角几何研究者）提醒所有人「机器人是 SLAM …

深度学习 2023年4月10日
000
Atitit 机器学习算法分类目录 1. 传统的机器学习算法 vs 深度学习 1 1.1. 传统的机器学习算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。 2 2. 监

Atitit 机器学习算法分类目录 1. 传统的机器学习算法 vs 深度学习 1 1.1. 传统的机器学习算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。 2 2. 监督学习与非监督学习 2 3. 连续型学习跳跃型学习 2 4. 根据学习方式分类 2 4.1. 包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboo…

深度学习 2023年4月11日
000
深度学习中卷积层和pooling层的输出计算公式(转)

原文链接：https://blog.csdn.net/yepeng_xinxian/article/details/82380707 1.卷积层的输出计算公式class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups…

深度学习 2023年4月13日
000
【动手学深度学习】学习笔记

【动手学深度学习】李沐——所有章节的学习记录，包括代码的解释及个人见解。线性神经网络图像分类数据集 import torch import torchvision from matplotlib import pyplot as plt from torch.utils import data from torchvision import transf…

深度学习 2023年4月11日
000
深度学习之对抗样本问题

2006 年，Geoffrey Hinton 提出了深度学习。受益于大数据的出现和大规模计算能力的提升，深度学习已然成为最活跃的计算机研究领域之一。深度学习的多层非线性结构使其具备强大的特征表达能力和对复杂任务的建模能力。最近几年，深度学习的发展也带动了一系列的研究。尤其是在图像识别领域，在一些标准测试集上的试验表明，深度模型的识别能力已经可以达到人类的水平…

深度学习 2023年4月13日
000
关于入门深度学习mnist数据集前向计算的记录

import osimport lr as lrimport tensorflow as tffrom pyspark.sql.functions import stddevfrom tensorflow.keras import datasetsos.environ[‘TF_CPP_MIN_LOG_LEVEL’]=’2′ #只打印error的信息(x,y)…

深度学习 2023年4月10日
000
深度学习之numpy.poly1d()函数

1、np.poly1d()此函数有两个参数：　　参数1：为一个数组，若没有参数2，则生成一个多项式，例如：　　　　　　p = np.poly1d([2,3,5,7]) 　　　　　　print(p) ==>>2×3 + 3×2 + 5x + 7 数组中的数值为coefficient（系数），从后往前 0，1，2.。。为位置书的…

深度学习 2023年4月13日
000

合作推广

合作推广

返回顶部