深度学习-个人理解

2023年4月14日上午8:12 • 深度学习

yizhihongxing

深度学习-个人理解

深度学习模型类似一个黑盒子，输入一组数据，产生一个输出，这个输出就可以称为得分函数的输出值。

根据输出值与实际值之间的比较，通过损失函数可以求得损失值。损失值越大，代表模型的分类效果越差。

其中，通过Softmax分类器可以将分类结果映射成概率。

前向传播和反向传播

前向传播：输入经过网络后产生一个得分值（或者分类概率），根据这个值求得Loss值

反向传播：基于当前的Loss值，参数通过链式法则回传，调整模型的参数

模型参数更新

方向：梯度的反方向（即Loss变化最快的方向）

大小：步幅（学习率），不能过大也不能过小。过大可能错过损失函数的最小收敛点，过小会花费更长的时间。

参数更新：大小*方向

为了防止训练参数中存在个别异常点，通常按照一个bachsize的平均值进行参数更新（批处理）

对于一个训练集来说，通常用两层循环，外层为epoch，内层为一个bachsize。

神经网络的其他内容

激活函数：防止反向传播时，出现传递的参数趋近于0的问题。

模型训练的过拟合问题：模型在训练集表现优秀，在测试集表现较差。

正则话参数，消除异常点对模型的影响。
drop-out，消除某些神经元，非全连接网络，防止出现过拟合现象。

数据预处理：消除x轴、y轴的差异，将差异归一化。

权重矩阵的初始化：不能全部一样，随机赋值。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：深度学习-个人理解 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

ubuntu搭建深度学习环境

上一篇 2023年4月14日

【机器学习入门与实践】数据挖掘-二手车价格交易预测（含EDA探索、特征工程、特征优化、模型融合等）

下一篇 2023年4月14日

深度学习（四）之电影评论分类

任务目标对中文电影评论进行情感分类，实现测试准确率在\(83\%\)以上。本文采用了3种模型对电影评论进行分类，最终，模型在测试集的结果分别为：模型 acc precision recall f1-score LSTM \(81.57\%\) [\(77.49\%\),\(86.69\%\)] [\(88.46\%\),\(74.87%\)] [\(82…

深度学习 2023年4月12日
000
windows搭建深度学习环境

一、独显二、装驱动 https://www.nvidia.cn/Download/index.aspx?lang=cn 三、装cuda 通用gpu加速库 1、查看gpu支持的对高版本的cuda nvdia控制面板——帮助——系统信息——组件 2、下载cuda https://developer.nvidia.com/cuda-toolkit-archive…

深度学习 2023年4月10日
000
推荐系统遇上深度学习(十)–GBDT+LR融合方案实战

0.8012018.05.19 16:17:18字数 2068阅读 22568 推荐系统遇上深度学习系列：推荐系统遇上深度学习(一)–FM模型理论和实践：https://www.jianshu.com/p/152ae633fb00推荐系统遇上深度学习(二)–FFM模型理论和实践:https://www.jianshu.com/p/781cde3d5f3d…

深度学习 2023年4月12日
000
[一本通学习笔记] 深度优先搜索与剪枝

深度优先搜索的剪枝优化还是很灵活的。但常规来说，比较通用的优化思路主要有两类。可行性剪枝最优性剪枝需要结合题目性质进行一定的理解与探究。必要时还可以加入一些启发式的优化。一本通上的几个例题和练习做得有点卡，代码也很丑陋。没怎么动脑子就直接dp了 #include <bits/stdc++.h> using namespace std…

深度学习 2023年4月11日
000
深度学习（二）之猫狗分类

目录任务目标数据集数据增强模型一：自定义网络模型二：使用resnet34做特征提取模型三：resnet34&vgg16做特征提取 trick 参考任务目标构建深度学习模型，对猫狗数据集进行分类（数据集来自kaggle），要求测试集的准确率不能低于\(75 \%\)。在本文中，使用了3个不同的模型进行分类，其测试集结果分别是：自定义卷…

深度学习 2023年4月11日
000
Uber发布史上最简单的深度学习框架Ludwig！

昨日，Uber官网重磅宣布新开源深度学习框架Ludwig，不需要懂编程知识，让专家能用的更顺手，让非专业人士也可以玩转人工智能，堪称史上最简单的深度学习框架！ Ludwig是一个建立在TensorFlow之上的工具箱，它允许用户在不需要编写代码的情况下训练和测试深度学习模型！简单到什么程度？令人发指！用户只需要提供一个包含数据的CSV文件，一…

深度学习 2023年4月11日
000
神经网络与深度学习[邱锡鹏] 第八章习题解析

只考虑一层简单的循环神经网络，设隐藏层神经元数量为D（即D维），输入层的维数为M。一个LSTM层（隐藏层）的参数总数为：4D*（D+M）+4D 8-2 8-3 8-4 按照内容寻址，阿西吧。 8-5 8-6 参见：Hopfield 神神经网络动力学分析与应用[郑鹏升]博士论文中8.9页

深度学习 2023年4月11日
000
基于深度学习的车辆检测系统（MATLAB代码，含GUI界面）

摘要：当前深度学习在目标检测领域的影响日益显著，本文主要基于深度学习的目标检测算法实现车辆检测，为大家介绍如何利用MATLAB设计一个车辆检测系统的软件，通过自行搭建YOLO网络并利用自定义的数据集进行训练、验证模型，最终实现系统可选取图片或视频进行检测、标注，以及结果的实时显示和保存。其中，GUI界面利用最新的MATLAB APP设计工具开发设计完成，算法…

深度学习 2023年4月12日
000

合作推广

合作推广

返回顶部