TensorFlow 深度学习笔记 Stochastic Optimization

2023年4月8日上午10:43 • tensorflow

转载请注明作者：梦里风林
Github工程地址：https://github.com/ahangchen/GDLnotes
欢迎star，有问题可以到Issue区讨论
官方教程地址
 视频/字幕下载

实践中大量机器学习都是通过梯度算子来求优化的
但有一些问题，最大的问题就是，梯度很难计算
我们要计算train loss，这需要基于整个数据集的数据做一个计算
而计算使 train loss 下降最快的调整方向需要的时间是计算train loss本身的三倍

TensorFlow 深度学习笔记 Stochastic Optimization

因此有了SGD：Stochastic Gradient Descent
- 计算train loss时，只随机取一小部分数据集做为输入
- 调整W和b时，调整的大小step需要比较小，因为数据集小，我们找到的不一定是对的方向
- 这样也就增加了调整的次数
- 但可观地减小了计算量

TensorFlow 深度学习笔记 Stochastic Optimization

SGD的优化

实际上SGD会使得每次寻找的方向都不是很准，因此有了这些优化

随机的初始值

TensorFlow 深度学习笔记 Stochastic Optimization

Momentum

考虑以前的平均调整方向来决定每一步的调整方向

TensorFlow 深度学习笔记 Stochastic Optimization

Learning Rate Decay
- 训练越靠近目标，步长应该越小
Parameter Hyperspace
- Learning Rate（即调整的step）不是越大越好，可能有瓶颈
- SGD有许多参数可以调整，所以被称为黑魔法
- AdaGurad
  - 自动执行momentum和learning rate decay
  - 使得SGD对参数不像原来那样敏感
  - 自动调整效果不如原来的好，但仍然是一个option

觉得得我的文章对您有帮助的话，就给个star吧～

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：TensorFlow 深度学习笔记 Stochastic Optimization - Python技术站

tensorflow 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

TensorFlow 深度学习笔记 Logistic Classification

上一篇 2023年4月8日上午10:42

Google TensorFlow深度学习笔记

下一篇 2023年4月8日上午10:43

循环神经网络

循环神经网络(RNN)的改进——长短期记忆LSTM

一：vanilla RNN 　　　使用机器学习技术处理输入为基于时间的序列或者可以转化为基于时间的序列的问题时，我们可以对每个时间步采用递归公式，如下，We can process a sequence of vector x by applying a recurrence formula at every time step：　　　　　…

2023年4月8日
000
PyTorch

pytorch创建tensor数据

一、传入数据 tensor只能传入数据可以传入现有的数据列表或矩阵 import torch # 当是标量时候，即只有一个数据时候，[]括号是可以省略的 torch.tensor(2) # 输出： tensor(2) # 如果是向量或矩阵，必须有[]括号 torch.tensor([2, 3]) # 输出： tensor([2, 3]) Tensor可以传…

2023年4月8日
000
狄利克雷卷积&莫比乌斯反演证明

狄利克雷卷积简介卷积这名字听起来挺学究的，今天学了之后发现其实挺朴实hhh。卷积： “（n）”表示到n的一个范围。设\(f,g\)是两个数论函数（也就是说，以自然数集为定义域的复数值函数），则卷积运算\(f\ast g\)定义为 \[(f\ast g)(n) = \sum_{ij=n}{f(i)g(j)} \] 另一种写法就是： \[(f\ast g)(…

卷积神经网络 2023年4月8日
000
PyTorch

基于pytorch框架的手写数字识别(mnist数据集)

前段时间开始学习pytorch，学习了一点pytorch的小语法，在网上找到了pytorch入门写CNN的代码，自己尝试读懂加上注释。更多的了解一下pytorch，代码注释写的还算清楚，在阅读代码之前可以看一下我收获的知识都是在代码里遇到的不会的语句，我自己通过阅读别博客获取的知识，大多数都是torch在读取数据的操作。先读一下这个有利于阅读代码。收获的知…

2023年4月8日
000
目标检测（五）YOLOv1—You Only Look Once:Unified,Real-Time Object Detection

之前的目标检测算法大都采用proposals+classifier的做法（proposal提供位置信息，分类器提供类别信息），虽然精度很高，但是速度比较慢，也可能无法进行end-to-end训练。而该论文提出的yolo网络是一个统一的single network，能够进行端到端的优化。作者说到，该结构特别快，base YOLO model可以做到每秒实时处理…

目标检测 2023年4月7日
000
Keras

Anaconda3如何安装keras

当下机器学习很火，机器学习编程最流行的就是python语言，yangqiang200608打算自学机器学习，于是与python有了缘。对于初学者来说，配置环境是最让人头痛的事情。一周前参照网上的资料折腾一番，终于安装上了python3，为了方便选择的是anaconda3按装的，这样可以剩去按装各种库的烦恼。要进行深度学习编程，还需要相应的库，如tensorf…

2023年4月8日
000
机器学习二逻辑回归

在生成模型中讲到了，可以利用手头的数据，假设数据是满足高斯分布，且是不同的均值，但是同一个协方差矩阵，基于贝叶斯的判别式，可以得到 p(c1|x)>0.5 是第一类 p(c1|x)可以转化为sigmod(z)=w*x +b

机器学习 2023年4月13日
000
tensorflow计算各个类别的正确率

import tensorflow as tf def count_nums(true_labels, num_classes): initial_value = 0 list_length = num_classes list_data = [ initial_value for i in range(list_length)] for i in rang…

tensorflow 2023年4月8日
000

合作推广

合作推广

返回顶部