动手学深度学习三—多层感知机MLP

2023年4月13日上午9:15 • 深度学习

1、隐藏层

多层感知机在单层神经网络中引入了一到多个隐藏层，隐藏层位于输入层和输出层之间

动手学深度学习三---多层感知机MLP

输入层特征数为4个，输出层标签类别为3，隐藏单元5个，输入层不涉及计算，多层感知机层数为2

隐藏层中神经元和输入层中各个输入完全连接，输出层神经元与隐藏层神经元完全连接，因此全连接层有两个：输出层和隐藏层

假设隐藏层权重和偏差分别为w_h、b_h，输出层权重和偏差分别为w_o、b_o，输出o的计算为

H = XW_h + b_h，

O =HW_o + b_o

即，O = (XW_h + b_h)W_o + b_o=XW_hW_o+b_hW_o+ b_o

此时，仍等价于单层神经网络，输出层权重为W_hW_o，偏差为b_hW_o+ b_o

问题：模型仍为线性模型，如何解决非线性问题？

解决方式：引入非线性变换---激活函数，解决非线性问题

2、激活函数

（1）ReLU函数

给定元素x，ReLU(x)=max(x,0)

动手学深度学习三---多层感知机MLP

（2）sigmod函数

将元素的值变换到0和1之间，在早期的神经网络中使用较为普遍，现在更常用的是ReLU

动手学深度学习三---多层感知机MLP

动手学深度学习三---多层感知机MLP

（3）tanh函数

tanh双曲正切函数可以将元素的值变换到-1和1之间

动手学深度学习三---多层感知机MLP

动手学深度学习三---多层感知机MLP

3、多层感知机

多层感知机就是含有至少一个隐藏层的由全连接层（隐藏层）组成的神经网络，其中每一个隐藏层的输出都会通过激活函数进行变换

多层感知机的层数和隐藏层的层数都是超参数，可以自己设定

动手学深度学习三---多层感知机MLP

动手学深度学习三---多层感知机MLP 表示激活函数

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：动手学深度学习三—多层感知机MLP - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

使用GIS平台玩转深度学习

上一篇 2023年4月13日

PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]

下一篇 2023年4月13日

C++深度解析教程学习笔记（1）C到C++的升级

比如商场收银系统 2.C 到 C++ 的升级 2.1变量的定义 C++中所有的变量都可以在需要使用时再定义,而 C 语言中的变量都必须在作用域开始位置定义。 2.2 register 关键字 (1)register 关键字请求编译器将局部变量存储于寄存器中在 C++中依然支持 register 关键字,但这只是为了兼容 C，C++编译器有自己的优化方式,在…

深度学习 2023年4月12日
000
20180813视频笔记深度学习基础上篇（1）之必备基础知识点深度学习基础上篇（2）神经网络模型

学习时间：2018年8月10日星期五视频地址：https://www.bilibili.com/video/av27877827 视频名称：深度学习基础上篇（1）之必备基础知识点第一课：深度学习人工智能=感知+决策+理解学习的能力是智能的本质大数据时代，通过大数据来学习数据规模越大越能体现深度学习算法的优势无人驾驶汽车：物体、…

深度学习 2023年4月11日
000
从贝叶斯角度，看深度学习的属性和改进方法

https://arxiv.org/abs/1706.00473 深度学习是一种为非线性高维数据进行降维和预测的机器学习方法。而从贝叶斯概率视角描述深度学习会产生很多优势，即具体从统计的解释和属性，从对优化和超参数调整更有效的算法，以及预测性能的解释这几个方面进一步阐述。同时，传统的高维统计技术：主成分分析法（PCA）、偏最小二乘法（PLS）、降秩回归（RR…

深度学习 2023年4月12日
000
2-9 什么是端到端的深度学习？

端到端学习到底是什么呢？简而言之，以前有一些数据处理系统或者学习系统，它们需要多个阶段的处理。那么端到端深度学习就是忽略所有这些不同的阶段，用单个神经网络代替它。以语音识别为例，你的目标是输入x，比如说一段音频，然后把它映射到一个输出y，就是这段音频的听写文本。所以和这种有很多阶段的流水线相比，端到端深度学习做的是，你训练一个巨大的神经网络，输入就是一段…

深度学习 2023年4月13日
000
移动端深度学习开源框架-前言0

感谢：https://www.jianshu.com/p/66a0a6fd3cae 深度学习和机器学习移动端化是未来趋势，这两年各个大厂都在这方面发力，竞相推出自己移动端的推理框架。 google: Tensorflow Lite apple: CoreML facebook: Caffe2 tencent: ncnn baidu: paddle mob…

深度学习 2023年4月11日
000
深度学习

深度学习-第三章概率与信息论

概率论是用于表示不确定性声明的数学框架。它不仅提供了量化不确定性的方法，也提供了用于导出新的不确定性声明（statement）的公理。概率论的知识在机器学习和深度学习领域都有广泛应用，是学习这两门学科的基础。前言概率论学科定义概率与信息论在人工智能领域的应用 3.1，为什么要使用概率论 3.2，随机变量 3.3，概率分布 3.3.1，离散型变量和概率质…

2023年4月9日
000
在OpenCV中基于深度学习的边缘检测

在OpenCV中基于深度学习的边缘检测昨天点击上方↑↑↑“OpenCV学堂”关注我来源：公众号 AI公园授权作者：ANKIT SACHAN 编译：ronghuaiyang 导读分析了Canny的优劣，并给出了OpenCV使用深度学习做边缘检测的流程，文末有代码链接。在这篇文章中，我们将学习如何在OpenCV中使用基于深度学习的边缘检测，它比目前…

深度学习 2023年4月12日
000
深度学习模型压缩与优化加速

转自：https://blog.csdn.net/baidu_31437863/article/details/84474847 深度学习（Deep Learning）因其计算复杂度或参数冗余，在一些场景和设备上限制了相应的模型部署，需要借助模型压缩、优化加速、异构计算等方法突破瓶颈。模型压缩算法能够有效降低参数冗余，从而减少存储占用、通信带宽和计算复杂度…

深度学习 2023年4月13日
000

合作推广

合作推广

返回顶部