TensorFlow学习笔记1：graph、session和op

2023年4月7日下午10:20 • tensorflow

graph即tf.Graph()，session即tf.Session()，很多人经常将两者混淆，其实二者完全不是同一个东西。

graph定义了计算方式，是一些加减乘除等运算的组合，类似于一个函数。它本身不会进行任何计算，也不保存任何中间计算结果。
session用来运行一个graph，或者运行graph的一部分。它类似于一个执行者，给graph灌入输入数据，得到输出，并保存中间的计算结果。同时它也给graph分配计算资源（如内存、显卡等）。

TensorFlow是一种符号式编程框架，首先要构造一个图（graph），然后在这个图上做运算。打个比方，graph就像一条生产线，session就像生产者。生产线具有一系列的加工步骤（加减乘除等运算），生产者把原料投进去，就能得到产品。不同生产者都可以使用这条生产线，只要他们的加工步骤是一样的就行。同样的，一个graph可以供多个session使用，而一个session不一定需要使用graph的全部，可以只使用其中的一部分。

关于graph

定义一个图：graph

g = tf.Graph()
a = tf.constant(2)
b = tf.constant(3)
x = tf.add(a, b)

上面就定义了一个graph。tensorflow会默认给我们建立一个graph，所以g = tf.Graph()这句其实是可以省略的。上面的graph包含3个操作，即op，但凡是op，都需要通过session运行之后，才能得到结果。如果你直接执行print(a)，那么输出结果是：

Tensor("a:0", shape=(), dtype=int32)

是一个张量（Tensor）。如果你执行print(tf.Session().run(a))，才能得到2.

关于子图：subgraph

你可以定义多个graph，例如一个graph实现z = x + y，另一个graph实现u = 2 * v

g1 = tf.Graph()
g2 = tf.Graph()
with g1.as_default():
    x = tf.constant(2)
    y = tf.constant(3)
    z = tf.add(x, y)
with g2.as_default():
    v = tf.constant(4)
    u = tf.mul(2, v)

但通常不建议这么做，原因如下：

运行多个graph需要多个session，而每个session会试图耗尽所有的计算资源，开销太大；
graph之间没有数据通道，要人为通过python/numpy传数据；

事实上，你可以把所有的op都定义在一个graph中：

x = tf.constant(2)
y = tf.constant(3)
z = tf.add(x, y)
v = tf.constant(4)
u = tf.mul(2, v)

从上面graph的定义可以看到，x/y/z是一波，u/v是另一波，二者没有任何交集。这相当于在一个graph里有两个独立的subgraph。当你要计算z = x + y时，执行tf.Session().run(z)；当你想计算u = 2 * v，就执行tf.Session().run(u)，二者完全独立。但更重要的是，二者在同一个session上运行，系统会均衡地给两个subgraph分配合适的计算资源。

关于session

通常我们会显示地定义一个session来运行graph：

x = tf.constant(2)
y = tf.constant(3)
z = tf.add(x, y)

with tf.Session() as sess:
    result = sess.run(z)
    print(result)

输出结果是5。

关于op

tensorflow是一个符号式编程的框架，首先要定义一个graph，然后用一个session来运行这个graph得到结果。graph就是由一系列op构成的。上面的tf.constant()，tf.add()，tf.mul()都是op，都要现用session运行，才能得到结果。

很多人会以为tf.Variable()也是op，其实不是的。tensorflow里，首字母大写的类，首字母小写的才是op。tf.Variable()就是一个类，不过它包含了各种op，比如你定义了x = tf.Variable([2, 3], name = 'vector')，那么x就具有如下op：

x.initializer # 对x做初始化，即赋值为初始值[2, 3]
x.value() # 获取x的值
x.assign(...) # 赋值操作
x.assign_add(...) # 加法操作

tf.Variable()必须先初始化，再做运算，否则会报错。下面的写法就不是很安全，容易导致错误：

W = tf.Variable(tf.truncated_normal([700, 10]))
U = tf.Variable(2 * W)

要把W赋值给U，必须现把W初始化。但很多人往往忘记初始化，从而出错。保险起见，应该按照下面这样写：

W = tf.Variable(tf.truncated_normal([700, 10]))
U = tf.Variable(2 * W.intialized_value())

一个特殊的op: tf.placeholder()

placeholder，翻译过来就是占位符。其实它类似于函数里的自变量。比如z = x + y，那么x和y就可以定义成占位符。占位符，顾名思义，就这是占一个位子，平时不用关心它们的值，当你做运算的时候，你再把你的数据灌进去就行了。是不是和自变量很像？看下面的代码：

a = tf.placeholder(tf.float32, shape=[3]) # a是一个3维向量
b = tf.constant([5, 5, 5], tf.float32)
c = a + b
with tf.Session() as sess:
    print sess.run(c, feed_dict = {a: [1, 2, 3]}) # 把[1, 2, 3]灌到a里去

输出结果是[6, 7, 8]。上面代码中出现了feed_dict的概念，其实就是用[1, 2, 3]代替a的意思。相当于在本轮计算中，自变量a的取值为[1, 2, 3]。其实不仅仅是tf.placeholder才可以用feed_dict，很多op都可以。只要tf.Graph.is_feedable(tensor)返回值是True，那么这个tensor就可用用feed_dict来灌入数据。

tf.constant()是直接定义在graph里的，它是graph的一部分，会随着graph一起加载。如果通过tf.constant()定义了一个维度很高的张量，那么graph占用的内存就会变大，加载也会变慢。而tf.placeholder就没有这个问题，所以如果数据维度很高的话，定义成tf.placeholder是更好的选择。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：TensorFlow学习笔记1：graph、session和op - Python技术站

tensorflow 人工智能

0 0 打赏

微信扫一扫

支付宝扫一扫

python/Anaconda3/Tensorflow/Pycharm ImportError: DLL load failed: 找不到指定的模块；ImportError: numpy.core.multiarray failed to import 报错解决

上一篇 2023年4月7日

TensorFlow Ops

下一篇 2023年4月7日

卷积神经网络

Deep Learning论文笔记之（五）CNN卷积神经网络代码理解 – blogernice

Deep Learning论文笔记之（五）CNN卷积神经网络代码理解自己平时看了一些论文，但老感觉看完过后就会慢慢的淡忘，某一天重新拾起来的时候又好像没有看过一样。所以想习惯地把一些感觉有用的论文中的知识点总结整理一下，一方面在整理过程中，自己的理解也会更深，另一方面也方便未来自己的勘察。更好的还可以放到博客上面与大家交流。因为基础有限，所以对论文的一些理…

2023年4月8日
000
循环神经网络

MLK | 一文理清深度学习循环神经网络

MLK，即Machine Learning Knowledge，本专栏在于对机器学习的重点知识做一次梳理，便于日后温习，内容主要来自于《百面机器学习》一书，结合自己的经验与思考做的一些总结与归纳。本次主要讲解的深度学习循环神经网络方面的知识。 ???? 导读简单来说吧，循环神经网络（Recurrent Neural Network）也就是我们常见的RNN了…

2023年4月8日
000
Caffe

caffe-ssd 训练自己的VOC数据集(一):转换VOC xml数据为lmdb格式

假设你已经做好了VOC数据标签，也就是xml文件，并且已经配置好了caffe-ssd的环境第一步，在caffe-ssd/data目录下本身自带有如下文件夹：然后在caffe-ssd/data目录下新建一个文件夹命名为VOCdevkit: 然后data目录下有：进入VOCdevkit目录内，新建VOC2007文件夹，然后再进入VOC2007文件夹内新建A…

2023年4月8日
000
卷积神经网络

【33】卷积步长讲解(Strided convolutions)

卷积步长（Strided convolutions）卷积中的步幅是另一个构建卷积神经网络的基本操作，让我向你展示一个例子。如果你想用3×3的过滤器卷积这个7×7的图像，和之前不同的是，我们把步幅设置成了2。你还和之前一样取左上方的3×3区域的元素的乘积，再加起来，最后结果为91。只是之前我们移动蓝框的步长是1，现在移动的步长是2，我们让过滤器跳过2个步…

2023年4月5日
000
循环神经网络

独家 | 数据科学家的必备读物：从零开始用 Python 构建循环神经网络（附代码）…

作者：Faizan Shaikh 翻译：李文婧校对：张一豪本文约4300字，建议阅读10+分钟。本文带你快速浏览典型NN模型核心部分，并教你构建RNN解决相关问题。引言人类不会每听到一个句子就对语言进行重新理解。看到一篇文章时，我们会根据之前对这些词的理解来了解背景。我们将其定义为记忆力。算法可以复制这种模式吗？神经网络（NN）是最先被想到的技术…

2023年4月8日
000
tensorflow

TensorFlow学习笔记——cmd调用方法

由于tensorflow支持最高的python的版本和anaconda自动配置的python最新版本并不兼容，故直接用常规的在终端键入“python”会出现问题。经过尝试对激活环境，调用的过程暂总结如下：其中之一的方法如图：　　大体语句思路可以总结为两部分：①激活tensorflow环境 ②找到所要执行文件的目录（两部分不分先后）之后便可以开始执行模…

2023年4月5日
000
Flow如何解决背压问题的方法详解

Flow如何解决背压问题的方法详解背压问题简介背压问题是指在异步编程中，当数据的生成速度高于消费速度，数据累积在缓冲区中，从而导致内存资源的浪费和应用程序的崩溃。传统的解决方案是通过手动控制缓冲区大小、控制数据的生成速度、减少数据量等方式来避免背压问题。 Flow解决背压问题的方法 Flow是一种反应式编程框架，它通过实现反压机制来解决背压问题。Flow…

tensorflow 2023年5月18日
000
《机器学习》学习笔记（二）：神经网络

在解决一些简单的分类问题时，线性回归与逻辑回归就足以应付，但面对更加复杂的问题时（例如对图片中车的类型进行识别），运用之前的线性模型可能就得不到理想的结果，而且由于更大的数据量，之前方法的计算量也会变得异常庞大。因此我们需要学习一个非线性系统：神经网络。我在学习时，主要通过Andrew Ng教授提供的网络，而且文中多处都有借…

机器学习 2023年4月11日
000