[Python自动化]使用Python Pexpect模块实现自动化交互脚本使用心得

yizhihongxing

使用Python Pexpect模块实现自动化交互脚本使用心得

参考文档:https://pexpect.readthedocs.io/en/stable/

前言

在最近的工作中,需要使用DockerFile构建镜像。在构建镜像的过程中,有一些执行的命令是需要交互的。例如安装tzdata(apt install tzdata),不过在使用apt安装时,可以直接使用DEBIAN_FRONTEND=noninteractive 前缀来取消交互(至于是禁止交互还是选择交互的默认值,这一点就不太清楚了,TODO)。具体的命令行就是DEBIAN_FRONTEND=noninteractive apt install -y tzdata。在Dockerfile中也可以使用ARG进行统一设置。不过这种前缀设置方法仅仅适用于apt(大概TODO)。还有另一种我一开始就想到的方法,也就是利用类Unix自带的管道(pipe)功能,实现进程间通信,或是将stdin文件描述符重定向为某个文本或是字符串。按道理这是可行的,但是经过我的测试,不知道为啥行不通(等待探索TODO)。

Docker镜像中需要构建一个rust环境,因此需要安装rust。安装rust的方法一般有两种

  • 使用官方推荐的 curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh 命令进行操作,这个命令首先下载脚本,然后将输出的脚本通过管道作为sh进程的输入(pipe,fork,exec,dup)。sh执行脚本的过程中会遇到一些交互,如果这时候将sh的stdin重定向到预定好的文件或是字符串,按道理是可以直接进行自动化交互的,至于为啥没能成功。。咱也不知道 (curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh) < in.in 为啥不能成功捏。
  • 直接使用apt install rust-all。这种方法确实方便,也没有任何交互,但是很多配置因为由于和rust官方可能不一样,很多环境变量没有设置($CARGO_HOME),有些时候还需要自己配置,属实是麻烦得很。

因此我迫切需要一个可以自动化交互的方法。在网上找了很久答案后,发现pexpect可以实现这种自动化交互。因此在这里需要学习pexpect的相关用法。(shell脚本中也有expect相关概念,但是由于shell脚本我用起来感觉有点不太适应,因此就用python了)。

Pexpect简介

Pexpect allows your script to spawn a child application and control it as if a human were typing commands.

Pexpect can be used for automating interactive applications such as ssh, ftp, passwd, telnet, etc. It can be used to a automate setup scripts for duplicating software package installations on different servers. It can be used for automated software testing.

一个中心:自动化,各种需要交互,需要输入都可以自动化。

安装

使用pip包管理进行安装

pip install pexpect -i https://pypi.tuna.tsinghua.edu.cn/simple/

在这里用清华源进行加速。

This version of Pexpect requires Python 3.3 or above, or Python 2.7.

以下的流程均在Ubuntu上进行,Windows等系统使用pexpect请参考:https://pexpect.readthedocs.io/en/stable/overview.html#windows

基本操作

在py脚本中,定义想要匹配的提示,然后进行对应的输出。其中匹配可以是字符串完全匹配也可以是正则表达式状态机匹配。

  • 通过pexpect.spawn方法进行脚本的执行
  • 配置expect,从而捕获匹配的字符串
  • 配置对应expect的响应

example

# This connects to the openbsd ftp site and
# downloads the recursive directory listing.
import pexpect
child = pexpect.spawn('ftp ftp.openbsd.org')
child.expect('Name .*: ')
child.sendline('anonymous')
child.expect('Password:')
child.sendline('noah@example.com')
child.expect('ftp> ')
child.sendline('lcd /tmp')
child.expect('ftp> ')
child.sendline('cd pub/OpenBSD')
child.expect('ftp> ')
child.sendline('get README')
child.expect('ftp> ')
child.sendline('bye')

注意事项

  1. 惊天巨坑

    由于匹配的字符串可以是正则表达式也可以是普通字符串,因此有些符号是需要转义的。
    比如我下面这个脚本

    import pexpect
    import sys
    child = pexpect.spawn('bash -c \'curl --proto \'=https\' --tlsv1.2 -sSf https://sh.rustup.rs | sh\'')
    child.expect("Continue\? \(y\/N\)")
    print("get 1")
    child.sendline("y")
    child.expect('>')
    print("get 2")
    child.sendline('1')
    child.expect(pexpect.EOF)
    

    如果child.expect("Continue\? \(y\/N\)")这句代码没有使用转义符号,那么就将卡死,这玩意卡了我半小时,属实是折磨了。

    惊天巨坑

  2. 当命令行中使用(>>,<<,|)等符号的时候,直接spwan+命令行是不起作用的,需要额外调用shell进行操作

    child = pexpect.spawn('bash -c \'curl --proto \'=https\' --tlsv1.2 -sSf https://sh.rustup.rs | sh\'')
    

    对应:curl --proto \'=https\' --tlsv1.2 -sSf https://sh.rustup.rs | sh

  3. If you wish to read up to the end of the child’s output without generating an EOF exception then use the expect(pexpect.EOF) method.

    正如文档中所说,不管怎么样,尽量都整一个expect(pexpect.EOF)来把EOF给吞掉

探索

有个问题,expect是顺序执行的还是随机匹配的呢?
可以使用一个没有安装rust的机器进行测试。没有安装rust的机器不会出现Continue\? \(y\/N\)这一提示。查看expect是否会跳过。实测不会跳过,会卡住。

经过文档的查看,使用

index = p.expect(['good', 'bad', pexpect.EOF, pexpect.TIMEOUT])
if index == 0:
    do_something()
elif index == 1:
    do_something_else()
elif index == 2:
    do_some_other_thing()
elif index == 3:
    do_something_completely_different()

index的操作,输入多个可匹配字符串,进行匹配,遇到哪个就执行哪个。

所以对于无序乱序输出的程序,可以使用一个循环,然后任意匹配。可以自定义一个状态机,通过输入的顺序决定执行的流程。

try:
    index = p.expect(['good', 'bad'])
    if index == 0:
        do_something()
    elif index == 1:
        do_something_else()
except EOF:
    do_some_other_thing()
except TIMEOUT:
    do_something_completely_different()

在上面这段代码中,EOF就可能是终止这个状态机,TIMEOUT也有可能会中止状态机。

最终Rust自动化无交互安装脚本如下

import pexpect
child = pexpect.spawn('bash -c \'curl --proto \'=https\' --tlsv1.2 -sSf https://sh.rustup.rs | sh\'')
try:
    while True:
        index = child.expect(['Continue\? \(y\/N\)','>'])
        if index == 0:
            child.sendline('y')
            print("Continue? (y/N) y")
        elif index == 1:
            child.sendline('1')
            print("> 1")
except pexpect.EOF:
    exit
except pexpect.TIMEOUT:
    print("timeout")

如果timeout了,可以适当将timeout变大一些,毕竟下载安装rust还是需要一定时间的

碎碎念

在我寻找答案的过程中,还发现了这么一个答案

curl https://sh.rustup.rs -sSf | sh -s -- -y

使用这个方法可以直接无交互自动化安装,但是这是一个特解。应用程序千千万万,如果每个应用程序都有特殊的无交互方式,那么需要了解所有的相关操作,这不免有点太累了。好处呢,就是这个方案基本上是永久有效,能够跟着应用程序更新。坏处呢也就是这只是一个特解,pexpect这个通解还是需要的。

原文链接:https://www.cnblogs.com/alyjay/p/17353067.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:[Python自动化]使用Python Pexpect模块实现自动化交互脚本使用心得 - Python技术站

(0)
上一篇 2023年4月25日
下一篇 2023年4月25日

相关文章

  • 更改Python的pip install 默认安装依赖路径方法详解

    下面是详细的攻略: 1. 背景介绍 在 Python 中,我们通常使用 pip 进行包管理。而在使用 pip 安装包的过程中,会依赖很多其他的包。默认情况下,这些依赖包都会被安装到 Python 的系统路径下,而这可能并不是我们想要的。 在实际项目中,我们可能需要将所有的依赖包都安装到一个指定的目录下(如项目目录下的 /lib 目录),这时就需要更改 pip…

    python 2023年5月14日
    00
  • python中不能连接超时的问题及解决方法

    以下是“Python中不能连接超时的问题及解决方法”的完整攻略,其中包括了问题的定义、解决方法、示例说明以及常见问题解决。 Python中不能连接超时的问题及解决方法 问题的定义 在Python中,我们经常会遇到不能连接超时的问题。这个问题通常是由于网络连接不稳定或目标服务器不可用导致的。当我们尝试连接一个不可用的服务器时,程序会一直等待,到超时。这个问题会…

    python 2023年5月13日
    00
  • python编写实现抽奖器

    下面是“python编写实现抽奖器”的完整攻略: 步骤一:准备工作 首先,我们需要安装Python环境,可以到官网下载安装包并进行安装。 接着,我们需要安装Python的第三方库——numpy,可以使用以下命令在命令行中进行安装: pip install numpy 安装完成后,就可以开始实现抽奖器啦! 步骤二:编写代码 我们先看一个最简单的例子,这个抽奖器…

    python 2023年5月19日
    00
  • Python 字符串去除空格的五种方法

    当我们使用Python处理字符串时,经常会遇到字符串中包含空格的情况。这时候,我们通常需要去除这些空格。本文将详细讲解Python字符串去除空格的五种方法。 方法一:使用strip()去除空格 strip()是Python内置的字符串方法,可以去除字符串前后的空格,代码如下: string = " hello, world! " new_…

    python 2023年6月5日
    00
  • Python urllib.request对象案例解析

    Python urllib.request对象案例解析 urllib.request 是 Python 自带的 HTTP 请求库,可以用于发送 HTTP 请求。以下是 Python urllib.request 对象案例解析。 发送 GET 请求 以下是使用 urllib.request 对象发送 GET 请求的示例: from urllib import …

    python 2023年5月15日
    00
  • python机器学习之KNN分类算法

    Python机器学习之KNN分类算法 KNN(K-Nearest Neighbors)是一种基本的分类算法,它的基本思想是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 KNN算法流程 KNN算法的流程如下: 计算测试样本与训练样本之间的距离; 选取距离最近的k个训练样本; 统计k个训练样…

    python 2023年5月14日
    00
  • Python3 pywin32模块安装的详细步骤

    Python3 pywin32模块安装的详细步骤 Python是一种通用的高级编程语言,它具有简单易学、优雅、可读性强等特点,受到广泛的应用。pywin32是Python的扩展模块之一,它提供了对Windows系统API的访问,可以让您更加方便地开发Windows应用程序。在此,我们将提供Python3 pywin32模块安装的详细步骤。 步骤 1:下载py…

    python 2023年5月14日
    00
  • Python3.10耙梳加密算法Encryption种类及开发场景

    Python3.10耙梳加密算法Encryption种类及开发场景 Python 3.10引入了一种新的加密算法——耙梳加密算法,也称为Encryption。本文将介绍耙梳加密算法的不同种类以及其在不同开发场景中的应用。 耙梳加密算法的种类 耙梳加密算法实际上是一组算法的集合,由多种不同的算法组成,每种算法都有其独特的特点。以下是耙梳加密算法的种类: Has…

    python 2023年6月3日
    00
合作推广
合作推广
分享本页
返回顶部