深度学习
-
吴恩达《深度学习》第五门课(3)序列模型和注意力机制
3.1序列结构的各种序列 (1)seq2seq:如机器翻译,从法文翻译成英文,将会是下面这样的结构,包括编码网络和解码网络。 (2)image to sequence:比如给一幅图像添加描述,如下图中的“一只猫站在椅子上”。同样包括编码网络和解码网络。 3.2选择最可能的句子 (1)机器翻译的本质就是一个条件语言模型,在给定输入的条件下输出最有可能的句子。 …
-
Uber发布史上最简单的深度学习框架Ludwig!
昨日,Uber官网重磅宣布新开源深度学习框架Ludwig,不需要懂编程知识,让专家能用的更顺手,让非专业人士也可以玩转人工智能,堪称史上最简单的深度学习框架! Ludwig是一个建立在TensorFlow之上的工具箱,它允许用户在不需要编写代码的情况下训练和测试深度学习模型! 简单到什么程度?令人发指! 用户只需要提供一个包含数据的CSV文件,一…
-
深度学习之Seq_seq网络
知识点 “”” 机器翻译: 历史: 1、逐字翻译 2、基于统计学的机器翻译 3、循环网络和编码 翻译过程: 输入 — > encoder –>向量 –> decoder –>output (RNN) (RNN) seq_seq应用:文本摘要、聊天机器人、机器翻译 seq_seq存在的问题: 1、压缩损失的信息 2、长度限制(一…
-
深度学习之加载VGG19模型分类识别
主要参考博客: https://blog.csdn.net/u011046017/article/details/80672597#%E8%AE%AD%E7%BB%83%E4%BB%A3%E7%A0%81http://www.cs.toronto.edu/~frossard/post/vgg16/ 1、物体分类 imagenet_classes.py cla…
-
深度学习之加载VGG19模型获取特征图
1、加载VGG19获取图片特征图 # coding = utf-8 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import os import scipy.io import scipy.misc def _conv_layer(input,weigh…
-
做深度学习应该如何选服务器?NLP、图像等
待补充 【参考博客】 【https://blog.csdn.net/mergerly/article/details/83753056】 【简书的一篇博客】 【简书的另一篇博客-讲组装机的】 【讲如何搭配深度学习服务器的博客】 【其他参考博客1】【博客2】【博客3】 【https://bbs.hupu.com/23084290.html】 【https://…
-
替代恐慌你有吗?程序员会被深度学习技术淘汰吗?
几天前,AlphaGO 3:0 轻松战胜了人类世界最顶尖的围棋选手柯洁,要知道围棋一直是人类族群中最复杂的高智商游戏,有句话叫千古无同局。你永远不可能走过相同的一盘棋,甚至每个地方都不一样。每一种可能都是一个分支数,然后每一个分支下面,还有无数个分支数。而且黑白之间,怎么判断哪个黑子比哪个白字强?这些都需要思考,判断,计算,而且要依赖于长年训练和积累。而Al…
-
深度学习系列专题之优化方法(1)总览
深度学习中定义的损失函数基本上都是极度非凸的函数,仅使用梯度下降法(SGD)很容易陷入局部最优解,本系列打算讲解以下方法: 1、SGD (On the importance of initialization and momentum in deep learning) 2、momentum 3、Nesterov accelerated gradient 4…
-
CV3——学习笔记-实战项目(上):如何搭建和训练一个深度学习网络
http://www.mooc.ai/course/353/learn?lessonid=2289&groupId=0#lesson/2289 https://adeshpande3.github.io/adeshpande3.github.io/The-9-Deep-Learning-Papers-You-Need-To-Know-About.ht…
-
【神经网络和深度学习】笔记 – 第三章 如何提高神经网络学习算法的效果
文章导读: 1.交叉熵损失函数 1.1 交叉熵损失函数介绍 1.2 在MNIST数字分类上使用交叉熵损失函数 1.3 交叉熵的意义以及来历 1.4 Softmax 2. 过拟合和正则化 2.1 过拟合 2.2 正则化 2.3 为什么正则化可以减轻过拟合问题 2.4 正则化的其它方法 3. 参数初始化 4. 其它方法 4.1…