Python爬虫实战:批量爬取百度图片

众所周知,某度本身就是最大的爬虫脚本,那么纯纯的去某个网站找壁纸,还不如去某度图片直接找,瞬间格局打开!

话不多说,直接用Python来开发一下此处资源!

开发环境 & 第三方模块

环境

解释器版本 >>> python 3.8
代码编辑器 >>> pycharm 2021.2

模块

requests  # 发送请求  第三方模块

 

键盘按住 win+r 打开搜索,输入cmd 按回车确定,弹出命令提示符窗口后,输入 pip install requests 回车即可安装。

代码展示

import requests    
# Python源码/资料自取群 708525271
 
# 伪装
headers = {
    # 身份信息
    'Cookie': 'BDqhfp=jk%E5%B0%8F%E5%A7%90%E5%A7%90%26%26NaN-1undefined%26%260%26%261; BIDUPSID=C24C7D8E598E67C686237DEAF51F7B28; PSTM=1656683846; BAIDUID=90512AA3632B152E5F977142A71CD0B0:SL=0:NR=10:FG=1; newlogin=1; MCITY=-%3A; BDUSS=VBkUnZuOUJjVWJRSzRQVmRrOFNuVlZpOWxXMXI2MmN5eUhmdG94aElsVXJXSWhqSVFBQUFBJCQAAAAAAAAAAAEAAADRI~rzv8nE3MrHybXByzMAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACvLYGMry2Bje; BDUSS_BFESS=VBkUnZuOUJjVWJRSzRQVmRrOFNuVlZpOWxXMXI2MmN5eUhmdG94aElsVXJXSWhqSVFBQUFBJCQAAAAAAAAAAAEAAADRI~rzv8nE3MrHybXByzMAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACvLYGMry2Bje; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598; indexPageSugList=%5B%22%E4%BB%96%E5%A6%88%E7%9A%84%20%E8%A1%A8%E6%83%85%E5%8C%85%22%2C%22%E6%87%92%20%E8%A1%A8%E6%83%85%E5%8C%85%22%2C%22%E6%88%91%E5%BE%88%E6%87%92%20%E8%A1%A8%E6%83%85%E5%8C%85%22%2C%22%E5%B0%B1%E8%BF%99%E6%A0%B7%E7%BB%93%E6%9D%9F%E4%BA%86%20%E8%A1%A8%E6%83%85%E5%8C%85%22%2C%22%E5%9C%9F%E5%BA%93%E6%9B%BC%E6%96%AF%E5%9D%A6%22%2C%22%E5%9C%9F%E5%BA%93%E6%9B%BC%E6%96%AF%E5%9D%A6%E4%B8%96%E7%95%8C%E5%9C%B0%E5%9B%BE%22%2C%22%E5%9C%9F%E5%BA%93%E6%9B%BC%E6%96%AF%E5%9D%A6%E4%B8%96%E7%95%8C%22%2C%22%E7%82%B9%E4%B8%AA%E8%B5%9E%20%E8%A1%A8%E6%83%85%E5%8C%85%22%5D; BA_HECTOR=240000240g8g058k2l848qet1hn93qn1f; ZFY=:AUZ:AsSR27Ydrc2egIjwyfTn:BiQthXJLEzDLR4IgwdOQ:C; BAIDUID_BFESS=90512AA3632B152E5F977142A71CD0B0:SL=0:NR=10:FG=1; BDRCVFR[feWj1Vr5u3D]=I67x6TjHwwYf0; delPer=0; BDRCVFR[C0p6oIjvx-c]=ddONZc2bo5mfAF9pywdpAqVuNqsus; BDRCVFR[fb3VbsUruOn]=_M5urk4djP3fA4-ILn; H_PS_PSSID=36545_37771_37778_37724_36802_37662_37538_37672_37741_26350_37786; BDRCVFR[dG2JNJb_ajR]=mk3SLVN4HKm; BDRCVFR[-pGxjrCMryR]=mk3SLVN4HKm; BDRCVFR[Txj84yDU4nc]=mk3SLVN4HKm; BDRCVFR[tox4WRQ4-Km]=mk3SLVN4HKm; BDRCVFR[X_XKQks0S63]=mk3SLVN4HKm; firstShowTip=1; PSINO=7; userFrom=www.baidu.com; ab_sr=1.0.1_ZDc4MzMwNmRiYmU4MjdiMDYyMGJlNjgzMzc0ZDU5OWRmMzg3OTk1NDY3ZjUzZGY3YWY0NGIzMzVhNzYyYzRlNzkzODc2ZmQxNDU5ZmIwZWFhNjQwYmE1MzVkMTY2YTI1YTRhNWYxOTY5MzE2YThkODJiNjQxNDk0MDYxMzBmNmNjOWMxMWUwOTI5MGUyZWU3ZmU1YjJhZjljN2ZlNzkyMg==',
    # 域名
    'Host': 'image.baidu.com',
    # 防盗链
    'Referer': 'https://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&dyTabStr=MCwzLDIsNSwxLDcsNCw2LDgsOQ%3D%3D&word=jk%E5%B0%8F%E5%A7%90%E5%A7%90',
    # 浏览器的基本信息
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'
}

url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&logid=8212365409067552127&ipn=rj&ct=201326592&is=&fp=result&fr=&word=jk%E5%B0%8F%E5%A7%90%E5%A7%90&queryWord=jk%E5%B0%8F%E5%A7%90%E5%A7%90&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=©right=&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&expermode=&nojc=&isAsync=&pn=90&rn=30&gsm=5a&1668600962847='

response = requests.get(url=url, headers=headers)

json_data = response.json()     # 字典

data_list = json_data['data']
count = 0
for data in data_list[:-1]:
    ObjUrl = data['replaceUrl'][0]['ObjUrl']
    img_data = requests.get(ObjUrl).content
    with open(f'{count}.jpg', mode='wb') as f:
        f.write(img_data)
    count += 1

 

效果展示

这难道比壁纸网站的差了吗?

Python爬虫实战:批量爬取百度图片

最后

# 我给大家准备了一些资料,包括2022最新Python视频教程、Python电子书10个G (涵盖基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题)、Python学习路线图等等,直接在这个君羊 708525271 自取即可!

 

正确学习Python的姿势:

今天的分享到这就结束了,记得点赞收藏,下次再见!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python爬虫实战:批量爬取百度图片 - Python技术站

(0)
上一篇 2023年4月2日
下一篇 2023年4月2日

相关文章

  • 我用Python做了个动图生成器,把一千个MM生成了GIF设置桌面,只为每天愉悦心情

    现在的年轻人都开始每天保温杯里泡枸杞,这怎么能行呢? 想要每天过的好,美女必然少不了,每天看美女,只为了愉悦心情,心情好了,才长寿。 于是怀揣着愉悦心情的想法,我开始制作GIF动图生成器,想要用Python来做成美女壁纸,行动起来。 这个小工具制作的目的是为了将多张图片组合后生成一张动态的GIF图片。设置界面化的操作,只需要将选中的图片导入最后直接生成动态图…

    Python开发 2023年3月31日
    00
  • Python骚操作!实现自动制作各种证件照,这不比PS快多了!

    事情是这样的 晚上我正在聚精会神写代码(打游戏~) 突然,收到学妹给我发来的消息 还有一张自拍照 而且是可以放在结婚证上的那种哦 就是 之前帮过她几次忙 难道要以身相许 去一起办证 原来是照片尺寸不合适 让我帮她修图。还要什么蓝底、红底各种背景的 虽然有些失落 还是,默默的撸出了我39米长的python大刀 先上效果 1、尺寸长宽调整为:295×413 2、…

    Python开发 2023年4月2日
    00
  • 这个Python读取文件的方法,堪称天花板级别…

    序言 哈喽兄弟们,今天咱们来了解一下 fileinput 。 说到fileinput,可能90%的码农表示没用过,甚至没有听说过。 这不奇怪,因为在python界,既然open可以走天下,何必要fileinput呢? 但是,今天我还是要介绍fileinput这个方法,因为太奈斯了。 不止是香。是真香! 接下来,就跟着我,一起fileinput,对,就是这个f…

    Python开发 2023年4月2日
    00
  • 重温Python基础——列表

    哈喽,兄弟们,今天让我们一起来重温一下Python基础中的列表,看看你还记得多少呢? 列表是什么 列表有一系列特定顺序排列的元素组成。可以包含字母表中的所有字母,数字等。其中的元素之间可以没有任何联系,列表通常包含多种元素。 在Python中用方括号([])表示列表,用逗号分隔其中的元素。 a=[‘wo’,’ai’,’xue’,’xi’,13,14]   访…

    Python开发 2023年4月2日
    00
  • Python丨听说这个地方的漫画不错,只用40行代码,给它全部爬下来

    前因后果 公司新来的小姐姐,超级喜欢看漫画,天天给我介绍,好烦~ 现在是2022年9月15日16点30,于是我决定, 五点下班前写个代码把她说的漫画全部爬下来,应付一下~ 再发篇文章揭露她的罪恶,嘿嘿~ 准备事项 环境使用 Python 3.8 Pycharm 2021.2版本   模块使用 import requests >>> # 数据…

    Python开发 2023年4月2日
    00
  • Python之字典添加元素

    本文使用代码 book_dict = {“price”: 500, “bookName”: “Python设计”, “weight”: “250g”}   第一种方式:使用[] book_dict[“owner”] = “tyson”   说明:中括号指定key,赋值一个value,key不存在,则是添加元素(如果key已存在,则是修改key对应的value…

    Python开发 2023年3月31日
    00
  • Python基于PC版微信实现机器人

    闲着没事总想搞点事情,这不是web版的微信有专门的实时收发消息api,可以用Python直接调用,但是现在基本上登录不了web版微信,所以就用不了了。 但这不是还有windows版的微信吗,于是在基于前辈写好的第三方库,今天我们来实现一下实时收发信息,实现自动聊天机器人。 效果展示 微信实时收发消息 1、第三方库 基于第三方pc-wechat-hook-ht…

    Python开发 2023年4月2日
    00
  • Python基础巩固:如何同时遍历多个序列

    哈喽兄弟们,又是巩固复习基础知识的一天~ 今天来实现一下如何同时遍历多个序列 一、实战场景 实战场景: 如何同时遍历多个序列。 二、主要知识点 同时遍历多个序列zip 函数 三、菜鸟实战 马上安排! 1、创建 python 文件 # 导入系统包 import platform # 我还给大家准备了海量资料:Python视频教程、100本Python电子书、基…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部