python常用小脚本实例总结

Python常用小脚本实例总结

简介

本文将分享几个常用的Python小脚本实例,这些脚本几乎可以应用在任何领域,也可以作为日常工作生活的小工具。

实例1:批量下载网页图片

我们经常需要从一个网页上面抓取很多图片,如果手动一个一个下载的话效率太低,这时候可以使用Python进行批量下载。我们在代码中引入requestsos两个模块,前者用于向服务器发起请求,获取网页内容和图片,后者用于管理本地文件。

import requests
import os

def download_imgs_from_url(url, folder_path):
    response = requests.get(url)
    if not response.ok:
        print('Response error:', response.status_code)
        return
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)
    for img_url in response.content.decode('utf-8').split('\n'):
        img_url = img_url.strip()
        if not img_url or img_url.startswith('#'):
            continue
        img_name = img_url.split('/')[-1]
        img_path = os.path.join(folder_path, img_name)
        with open(img_path, 'wb') as f:
            f.write(requests.get(img_url).content)
            print('Downloaded', img_path)
  • url是目标网页的链接;
  • folder_path是要保存图片的文件夹路径。

我们调用函数可以这样:

url = 'https://www.example.com/images/'
folder_path = './example/images/'
download_imgs_from_url(url, folder_path)

实例2:统计单词出现频率

我们可以使用Python统计一篇文章中不同单词出现的频率,这对于文本分析非常有用,这里使用的是纯文本文件,但同样适用于其他格式的文件。

import os

def count_words_freq(file_path):
    with open(file_path, encoding='utf-8') as f:
        words = f.read().lower().split()
    freq_dict = {}
    for word in words:
        if len(word) < 4:
            continue
        freq_dict[word] = freq_dict.get(word, 0) + 1
    freq_list = sorted(freq_dict.items(), key=lambda x:x[1], reverse=True)
    return freq_list
  • file_path是要分析的纯文本文件路径。

我们可以调用这个函数并打印出单词出现频率前十名:

file_path = 'example.txt'
freq_list = count_words_freq(file_path)
for word, freq in freq_list[:10]:
    print(word, freq)

总结

这里我们实现了两个小脚本,一个用于批量下载网页图片,一个用于统计单词出现频率,这些小脚本都可以在日常工作中使用,增强效率。在使用这些脚本时,我们需要注意数据来源的合法性和用户协议的要求,防止违反相关法律规定。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python常用小脚本实例总结 - Python技术站

(0)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • Python实现随机生成手机号及正则验证手机号的方法

    下面是详细的攻略: Python实现随机生成手机号及正则验证手机号的方法 在Python中,我们可以使用random模块和re模块来随机生成手机号并验证手机号的格式是否正确。本文将介绍Python实现随机生成手机号及正则验证手机号的方法,并提供两个示例说明。 随机生成手机号 在Python中,我们可以使用random模块的randint函数来生成随机数,并将…

    python 2023年5月14日
    00
  • Python_查看sqlite3表结构,查询语句的示例代码

    下面是关于Python中查看SQLite3表结构和查询语句的攻略,具体步骤如下: 一、安装SQLite 首先,需要安装SQLite3,具体操作步骤如下: 打开命令行或终端窗口; 输入命令sqlite3,如果提示“command not found”,则说明未安装SQLite3; 在命令行或终端窗口中输入sudo apt-get install sqlite3…

    python 2023年6月3日
    00
  • Python函数进阶与文件操作详情

    Python函数进阶与文件操作详情 本篇攻略介绍Python中函数进阶与文件操作的相关内容,主要包括以下几个方面: 函数进阶 函数参数传递 匿名函数 递归函数 文件操作 文件读写 文件遍历与操作 函数进阶 函数参数传递 在Python中,可以通过位置参数、默认参数、可变参数和关键字参数四种方式对函数进行参数传递。 位置参数 位置参数是指直接通过顺序传递参数值…

    python 2023年5月13日
    00
  • 在ipython notebook中使用argparse方式

    使用argparse库可以解析命令行参数,并通过命令行来传递参数。在IPython Notebook中使用argparse可以帮助我们更好的管理和控制Notebook中的程序。 以下是在IPython Notebook中使用argparse的完整攻略: 安装 首先要确保argparse库已经安装。如果没有安装,可以通过pip命令进行安装: !pip inst…

    python 2023年6月3日
    00
  • python爬虫URL重试机制的实现方法(python2.7以及python3.5)

    下面我会详细讲解“Python爬虫URL重试机制的实现方法”。 什么是URL重试机制? 在爬虫过程中,有时会出现由于网络原因或其他因素导致请求一个URL失败的情况。如果不对这种情况进行特别处理,爬虫程序就会停止工作。为了避免这种情况的发生,我们常常需要对请求失败的URL进行重试,直到请求成功为止。这种对请求失败的URL进行重试的机制就被称为URL重试机制。 …

    python 2023年5月14日
    00
  • pycharm设置默认的UTF-8编码模式的方法详解

    下面是详细讲解pycharm设置默认的UTF-8编码模式的方法: 1. 打开Pycharm设置界面 首先,需要打开Pycharm软件,点击菜单栏的“File”(文件),然后选择“Settings”(设置)。 2. 进入编辑器默认选项卡 在Pycharm的设置界面中,点击左侧的“Editor”(编辑器)标签,在下面的选项卡中选择“File Encodings”…

    python 2023年5月31日
    00
  • 通过代码实例了解Python sys模块

    下面是关于“通过代码实例了解Python sys模块”的完整攻略。 简介 Python的sys模块提供了与Python解释器交互的函数和变量。这个模块通常用于访问命令行参数、查看Python解释器的版本、与操作系统交互等方面。下面我们通过几个示例来看看该模块的具体用法。 获取命令行参数 有时需要在程序中获取命令行参数,而sys模块提供了一个名为argv的列表…

    python 2023年6月2日
    00
  • 详解Python中的正则表达式的用法

    详解Python中的正则表达式的用法 正则表达式是一种强大的文本处理工具,可以用于匹配、搜索、替换和分割文本。Python中的re模块提供了对正则表达式的支持,使得我们可以在中使用正则表达式。本文将为您详细讲解Python的正则表达的用法。 正则表达式的基语法 则表达式是由一系列字符和特殊字符组成的模式,用于匹配文本中的字符串。下面是些常用的正则表达式的特殊…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部