python生成器

生成器

我们学习完推导式之后发现,推导式就是在容器中使用一个for循环而已,为什么没有元组推导式?

原因就是“元组推导式”的名字不是这样的,而是叫做生成器表达式。

什么是生成器

生成器表达式本质上就是一个迭代器,是定义迭代器的一种方式,是允许自定义逻辑的迭代器。生成器使用generator表示。

迭代器和生成器的区别

迭代器本身是系统内置的, 无法重写内置的逻辑结构;而生成器是用户自定义的,可以重写逻辑结构。所以生成器就是一个迭代器,只是我们将自己写的迭代器叫做生成器作为区分而已。

创建方式

生成器有两种创建方式

  1. 生成器表达式,就是“元组推导式”
  2. 生成器函数,就是使用def定义,里面使用yield关键字

生成器表达式

基本语法

from collections import Iterator, Iterable

# 生成器表达式(元组推导式)
gen = (i * 2 for i in range(1, 11))
print(isinstance(gen, Iterable))  # 判断是否是迭代对象
print(isinstance(gen, Iterator))  # 判断是否是迭代器

# 这个 gen 就是生成器

生成器函数

我们上面说到,生成器函数如何定义?其实和普通的函数定义的方法是一样的,都是要使用def关键字来定义,其它的写法没有任何要求,普通函数怎么写生成器函数就怎么写,唯一的要求就是要使用yield关键字。

要注意,生成器函数就是一个函数,是使用了yield的函数,只不过生成器函数是用来定义生成器的。

yield关键字

yield这个关键字其实类似于return关键字,return关键字的作用是在函数中使用,用来返回数据,yield关键字的作用也是一样的,就是用来返回数据,但是和return还有其它的不同之处。

yield和return

共同点

执行到对应语句的时候,就会返回对应的值。

不同点

return执行的时候,函数就跳出,然后return之后的所有作用域语句就会全部跳出,当函数再次调用的时候,整个函数就重新执行。

yield执行的时候,返回数据,但是函数就会记住跳出的位置,当你再次调用函数(生成器)的时候,就从上一次跳出的地方继续执行,是不是和迭代器的取值有异曲同工之处?

yield的使用方法

yield的使用方法有两种,一种是和return的使用方法一样,在关键字的后面直接添加返回值,这是推荐使用的方法;

第二种方法使用将yield作为一个函数使用,就是在yield后面使用括号,在括号中填写返回的值。

生成器函数的基本使用

# 1、定义一个生成器函数
# 生成器函数就是一个使用yield的函数
def myGen():
	print(1)
	yield 11
	print(2)
	yield 22
	print(3)
	yield 33


# 2、初始化生成器
# 执行生成器函数,返回一个对象,就是生成器对象,简称生成器
from collections import Iterator
gen = myGen()
res = isinstance(gen, Iterator)
print(res)  # True  返回True说明生成器本质上就是一个迭代器


# 3、调用生成器
# 生成器本质上就是一个迭代器,还记得迭代器如何调用吗?
res = next(gen)
print(res)
"""
结果:
1   (生成器函数中的语句 print(1))
11  (yield返回的值,print(res))
"""

send的使用

sendnext一样,都是用来取出迭代器中的值的函数,send是生成器的内置函数。而且send和next相比,功能更加的强大,next只能取值;send不但能取值,而且还能发送值。

实例

定义生成器函数

def myGen():

   print('process start')
   #  res获取yield的值
   res = yield 100

   print(res, '内部打印1')
   print('process start')
   res = yield 200

   print(res, '内部打印2')
   print('process start')
   res = yield 300

   print(res, '内部打印3')

初始化生成器

gen = myGen()

第一次调用生成器

# 在使用send时,第一次传递的数据必须是None,这是硬性语法,以为send第一次传递参数的时候,还没有遇到yield,所以不能传送。
res = gen.send(None)

print(res)
"""
结果:
process start
100
"""

使用send第一次调用生成器的时候执行了下面的语句:

print('process start')
res = yield 100

执行到yield 100的时候,才碰到了yield,但是send之前没有遇到过yield,所以不能传入任何值,None没有任何意义,这是硬性语法。

这里注意,res = yield 100中的res此时没有任何价值。因为这个一条语句我们目前只执行了一半,执行了yield 100,还有res的赋值没有完成,所以现在的res没有任何的意义。

第一次调用生成器,返回100,这个100则是语句res = yield 100返回的值。

第二次调用

res = next(gen)
print(res)
"""
结果:
None 内部打印1
process start
200
"""

第二次调用执行了以下语句:

res = yield 100
print(res, '内部打印1')
print('process start')
res = yield 200

注意,生成器函数在调用的时候,会从上一次yield返回值的地方,就是res = yield 100,但是这个语句第二次调用的时候,只会执行一半,因为另一半在第一次调用的时候已经执行完了,就是yield 100,就是说还有res的赋值没有进行,但是第二次调用使用的是next,next没有传送值的能力,所以res就没有赋予任何值,,在打印的时候,res就是一个None。

第三次调用

res = gen.send('第三次调用')
print(res)
"""
结果:
第三次调用 内部打印2
process start
300
"""

第三次调用执行的语句是:

res = yield 200
print(res, '内部打印2')
print('process start')
res = yield 300

这次和第二次的调用基本是一样的,但是这次是使用send调用,所以传送了值过去,执行于是将值赋予了res。

第四次调用

res = gen.send(None)
print(res)

"""
结果:
None 内部打印3
StopIteration  (报错)
"""

第四次调用,执行以下语句:

res = yield 300
print(res, '内部打印3')

第四次调用生成器,没有可以执行的yield语句,所以返回不了任何数据,因此报出了 StopIteration的错误。

可迭代对象的优化

现在我们就已经学习完了容器和迭代器、生成器的相关知识,我们也知道了可迭代对象和迭代器的区别,那么现在我们要说的是,如果我们需要制定一个容器供我们遍历使用,那么我们优先使用迭代器而不是容器这样的一个普通的可迭代对象。

在我们之后的日常使用过程当中,我们有时就会发现,我们需要在一个循环中遍历一个容器供我们使用,但是这个容器中的值非常多,使这个容器占据的内存空间非常大,消耗了大量的资源,导致我们的程序非常慢。这个时候我们就需要使用迭代器或者生成器去遍历,迭代器每次遍历只占据当次遍历时的内存空间,因此非常的节省资源,所以这就是我们优先使用迭代器的理由。

总结

现在我们就学习完了python中的所有的函数类型,知道了python中的有内置函数、自定义函数,之后我们还会学习一些python的常用标准库和第三方库,里面也有一些我们经常用到的函数。

  1. 普通函数,使用def定义
  2. 匿名函数,使用lambda定义
  3. 闭包函数,内函数调用外函数的变量,并且外函数将内函数返回,这样的嵌套下,外函数就是一个闭包函数,但是一般的情况下,我们并不特意的作出一个闭包函数,而是要使用闭包这么一个功能
  4. 高阶函数,就是将函数作为参数使用的函数,常用的内置高阶函数有map、filter、reduce、sorted
  5. 递归函数,自己调用自己的函数

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python生成器 - Python技术站

(0)
上一篇 2023年4月2日 下午5:36
下一篇 2023年4月2日 下午5:36

相关文章

  • Python 函数进阶-全局空间和局部空间

    全局空间和局部空间 命名空间 命名空间的概念的提出是为了划分和控制变量是否可见,以及生存周期的长短;命名空间的作用范围叫做作用域。 划分一块区域保存所有数据,以字典的方式存储(变量与值形成映射关系)。一共三种。 内建命名空间: 解释器启动时创建,直到解释器运行结束,生存周期最长; 全局命名空间: 文件运行时创建,直到解释器运行结束,生存周期较长; 局部命名空…

    Python开发 2023年4月2日
    00
  • Python 函数进阶-递归函数

    递归函数 什么是递归函数 如果一个函数,可以自己调用自己,那么这个函数就是一个递归函数。 递归,递就是去,归就是回,递归就是一去一回的过程。 递归函数的条件 一般来说,递归需要边界条件,整个递归的结构中要有递归前进段和递归返回段。当边界条件不满足,递归前进,反之递归返回。就是说递归函数一定需要有边界条件来控制递归函数的前进和返回。 定义一个简单的递归函数 #…

    Python开发 2023年4月2日
    00
  • python常用内置函数和关键字

    常用内置方法 在Python中有许许多多的内置方法,就是一些Python内置的函数,它们是我们日常中经常可以使用的到的一些基础的工具,可以方便我们的工作。 查看所有的内置类和内置方法 # 方法一 built_list = dir(__builtins__) # 方法二 import builtins built_list = dir(builtins) 其中…

    Python开发 2023年4月2日
    00
  • python常用标准库(os系统模块、shutil文件操作模块)

    常用的标准库 系统模块 import os 系统模块用于对系统进行操作。 常用方法 os模块的常用方法有数十种之多,本文中只选出最常用的几种,其余的还有权限操作、文件的删除创建等详细资料可以参考官方文档。 system — 执行系统命令 参数的数据类型是字符串格式,内容是系统指令。执行时,直接返回系统输出。 import os os.system(‘ifc…

    Python开发 2023年4月2日
    00
  • python常用标准库(时间模块time和datetime)

    常用的标准库 time时间模块 import time time — 获取本地时间戳 时间戳又被称之为是Unix时间戳,原本是在Unix系统中的计时工具。 它的含义是从1970年1月1日(UTC/GMT的午夜)开始所经过的秒数,不考虑闰秒。UNIX时间戳的 0 按照ISO 8601规范为 :1970-01-01T00:00:00Z。 比如: 时间戳 60 …

    Python开发 2023年4月2日
    00
  • python常用标准库(压缩包模块zipfile和tarfile)

    常用的标准库 在我们常用的系统windows和Linux系统中有很多支持的压缩包格式,包括但不限于以下种类:rar、zip、tar,以下的标准库的作用就是用于压缩解压缩其中一些格式的压缩包。 zip格式 import zipfile zipfile模块操作压缩包使用ZipFile类进行操作,使用方法和open的使用方法很相似,也是使用r、w、x、a四种操作模…

    Python开发 2023年4月2日
    00
  • python常用标准库(math数学模块和random随机模块)

    常用的标准库 数学模块 import math ceil — 上取整 对一个数向上取整(进一法),取相邻最近的两个整数的最大值。 import math res = math.ceil(4.1) print(res) # 5 floor — 下取整 对一个数向下取整(退一法),取相邻最近的两个整数的最小值。 import math res = math.…

    Python开发 2023年4月2日
    00
  • Python推导式

    推导式 什么是推导式 推导式是 for 循环的简化使用方法,使用推导式,将一个可迭代对象中的数据遍历到某一个容器当中。简单的来说就是用一行for循环语句,遍历一个可迭代对象中的所有数据,然后将遍历出来的数据进行处理放入对应的容器中的一个过程和方式。 和推导类似作用的还有三元运算符,三元运算符是条件判断语句的简化使用方法。 语法 val for val in …

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部