为了防止这个公众号被封,我连夜用Python爬取了它所有图片~

哈喽兄弟们,今天来试试批量获取公众号文章,emmm…

为了防止这个公众号被封,我连夜用Python爬取了它所有图片~

 

 

虽然名义上是文章,单其实它是一篇纯图片文,至于为什么不是文字,小姐姐不比文字香?

为了防止这个公众号被封,我连夜用Python爬取了它所有图片~

 

 

事前准备

为了防止这个公众号被封,我连夜用Python爬取了它所有图片~

 

 

我们需要用到 Fiddler Everywhere 这个软件,Crack是本次要使用到的文件,以及要安装微信PC版客户端,我专门录了一个安装 及使用的教程。

本次使用的是Python3.8 以及 pycharm2021,这是目前比较稳定的版本。

模块方面需要安装一个requests 模块,它是第三方模块,需要手动安装,win+R 打开运行框输入cmd 按回车打开命令提示符窗口,输入pip install requests 按回车即可安装。

效果展示

太过份的我就不展示了,影响不好,我们是技术爱好者,不是那啥爱好者~

为了防止这个公众号被封,我连夜用Python爬取了它所有图片~

 

 

主要代码

# 软件和安装教程、代码在这个群 279199867 自取哈
headers = {
    'Host': 'mp.weixin.qq.com',
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36 NetType/WIFI MicroMessenger/7.0.20.1781(0x6700143B) WindowsWechat(0x63060012)',
    'Cookie': 'wxuin=2408215323; lang=zh_CN; pass_ticket=TsrY5cXMvTN01ghVFxFxT9k4jdPONJBt8mdl0ta20qxjUHNsnkkWLjib4gXCXSQM; devicetype=android-29; version=2800153f; wap_sid2=CJvmqfwIEooBeV9IQVVCUVAzdVBlWEo5NTlySFpON1Ffek5zTE9qRi1jdWZjVFMyOFYyM0FyVE9RSTRNZ3VuUXFTcU94Q3lKY1VyQlJ2RkEtTWFyRWFLeHhJUTRrWmp0N0VDZ05zOFV4d0kzZ1p5cXBIbTVBbEZGRWJteEt4Q0oxSjY4ZHFhODlaZnMyY1NBQUF+MOXS6ZIGOA1AlU4=',
}
# ::text
for page in range(0, 3):
    url = f'https://mp.weixin.qq.com/mp/profile_ext?action=getmsg&__biz=MzU0MzU4OTY2NQ==&f=json&offset={page * 10}&count=10&is_ok=1&scene=&uin=777&key=777&pass_ticket=&wxtoken=&appmsg_token=1161_7%252BO7mVaQbImKSRrYWqKBnNggweX4WNZaqjadeg~~&x5=0&f=json'
    json_data = requests.get(url=url, headers=headers).json()
    general_msg_list = json_data['general_msg_list']
    general_msg_list = json.loads(general_msg_list)['list']
    # print(general_msg_list)
    title_list = []
    content_url_list = []
    for general_msg in general_msg_list:
        title = general_msg['app_msg_ext_info']['title']
        content_url = general_msg['app_msg_ext_info']['content_url']
        multi_app_msg_item_list = general_msg['app_msg_ext_info']['multi_app_msg_item_list']
        title_list.append(title)
        content_url_list.append(content_url)
        for multi_app_msg_item in multi_app_msg_item_list:
            title_list.append(multi_app_msg_item['title'])
            content_url_list.append(multi_app_msg_item['content_url'])
    # print(title_list)
    # print(content_url_list)
    zip_data = zip(title_list, content_url_list)
    for detail_title, detail_url in zip_data:
        if not os.path.exists('img/' + detail_title):
            os.mkdir('img/' + detail_title)
        # 1. 发送请求
        response = requests.get(url=detail_url, headers=headers)
        # 2. 获取数据
        html_data = response.text
        # 3. 解析数据
        # 正则匹配数据 第一个参数 需要匹配的规则
        # 第一个参数 在哪个字符串里面匹配
        img_list = re.findall('data-src="(https://mmbiz.qpic.cn/.*?)"', html_data)
        print(detail_title) 

 

我也录制了对应的视频讲解:Python采集公众号文章

最后推荐一套Python教程:Python实战100例

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:为了防止这个公众号被封,我连夜用Python爬取了它所有图片~ - Python技术站

(0)
上一篇 2023年4月2日
下一篇 2023年4月2日

相关文章

  • Python写一个自动发送直播弹幕的工具,非常好用!

    昨晚回家,表弟在看LOL直播,看得我气不打一处来,差点就想锤他。 身为程序员的表弟,看直播发弹幕居然还在手动发,当时我就用Python写了一个自动发送弹幕的脚本送给他用。 好了话不多说,我们直接开搞! 先看看效果 名字我就打码了,当然名字不是关键,我直接截图展示算了,GIF的话,太麻烦了。 接下来我们要准备好你想发送的弹幕内容 这个我都是随便打的,大家可以自…

    Python开发 2023年3月31日
    00
  • Python生成字母对后写入文件

    一、人生苦短,我用Python 1、案例背景 生成字母对并写入文件,并将结果写入文件中。 文件中每行为: ab cd ef gh 2、主要知识点 文件读写 基础语法 zip 函数 字符串步长截取 3、素材 二、代码展示 创建一个py文件夹 咱们先导入需要用的模块 import platform import string # 我给大家准备了这些资料:Pyth…

    Python开发 2023年4月2日
    00
  • 用Python计算从1到500之间偶数的和

    兄弟们,今天来实现一下用Python计算1到500的偶数总和,灰常简单,检验一下大家基础学的怎么样! 涉及到的知识点 range 使用 for 循环 推导式 函数调用 # 这应该都学过吧,如果刚刚接触Python,基础都还没怎么学的话,加Q群 279199867,领取2022最新的Python视频教程、100本Python电子书、基础、爬虫、数据分析、web…

    Python开发 2023年4月2日
    00
  • Python做游戏其实很简单,只是你觉得难…

    很多小伙伴都喜欢小游戏源码,想学一手Python做小游戏,问我做游戏难不难,要怎么做,接下来我就介绍一下,如何用Python做游戏。 游戏演示 2048小游戏 表白弹窗 贪吃蛇 五子棋 俄罗斯方块 超多小游戏,让你一个爽个够! 用PyGame做游戏非常简单,我们今天第一篇文章,让大家实现一个可以在地图上移动的小猪。 基本框架 首先,无论你是做什么游戏,别管三…

    Python开发 2023年4月2日
    00
  • 14个Python处理Excel的常用操作,我先试过了,非常好用

    自从学了Python后就逼迫用Python来处理Excel,所有操作用Python实现。目的是巩固Python,与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了,直接进入正题。 数据是网上找到的销售数据,长这样: 一、关联公式:Vlookup vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先把这张表分为两个表。 df1…

    Python开发 2023年3月31日
    00
  • 下班在家没事干?教大家用Python做一个任何视频都能看的软件, 当然,只能看正经的!

    这不,国庆假期结束了,又得开始上班下班之旅了~ 有没有被疫情堵着出不来的呢?     话说回来,放这么久的假,大家还记得Python吗? 这不是怕大家又不能出去旅游,回家了或者在宿舍没事干太无聊,所以特地给大家献上如何用Python来开发一款看视频不需要VIP的软件~ 如果想发给朋友用的话,咱们在打包成exe可执行软件,这样小伙伴也能一起用了~ 效果展示 我…

    2023年4月2日
    00
  • python 装饰器

    一、我们在python语言中  常用@classmethod、@staticmethod这个装饰器,装饰器的作用简单来讲就是我们在很多地方可能都会用到一下相同的功能,这时我们会有两种想法。 1. 将这部分相同的功能封装成函数,然后在使用这个功能的时候程序中调用这个函数。 2. 将这部分相同的功能封装成装饰器,然后在使用这个功能的时候在需要处理的方法前加上对应…

    Python开发 2023年4月2日
    00
  • 利用Python自动生成请假条

    哈喽兄弟们,今天咱们来实现用Python来批量生成请假条,这回既学了东西又做了事情,两不误~ 本文就将基于一个真实的办公案例进行讲解如何提取Excel内容并创建Word 主要将涉及以下三个知识点 openpyxl 读取 Excel 文件 python-docx 写入 Word 文件 python-docx 各类样式的设计和调整 需求描述 你是公司的底层小虾米…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部