python爬虫伪装请求头—fake-useragent

2023年4月11日上午2:28 • 爬虫

在编写爬虫进行网页数据的时候，大多数情况下，需要在请求是增加请求头，下面介绍一个python下非常好用的伪装请求头的库：fake-useragent，具体使用说明如下：

安装fake-useragent库

pip install fake-useragent

获取各浏览器的fake-useragent

from fake_useragent import UserAgent
ua = UserAgent()
#ie浏览器的user agent
print(ua.ie)

#opera浏览器
print(ua.opera)

#chrome浏览器
print(ua.chrome)

#firefox浏览器
print(ua.firefox)

#safri浏览器
print(ua.safari)

#最常用的方式
#写爬虫最实用的是可以随意变换headers，一定要有随机性。支持随机生成请求头
print(ua.random)
print(ua.random)
print(ua.random)

示例代码

from fake_useragent import UserAgent
import requests
ua=UserAgent()
#请求的网址
url="http://www.baidu.com"
#请求头
headers={"User-Agent":ua.random}
#请求网址
response=requests.get(url=url,headers=headers)
#响应体内容
print(response.text)
#响应状态信息
print(response.status_code)
#响应头信息
print(response.headers)

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python爬虫伪装请求头—fake-useragent - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

小白从零自学python爬虫之福彩3d实战

上一篇 2023年4月11日

爬虫笔记(十三)——lxml库的使用

下一篇 2023年4月11日

Python爬虫之post请求

暑假放假在家没什么事情做，所以在学习了爬虫，在这个博客园里整理记录一些学习的笔记。构建表单数据（以http://www.iqianyue.com/mypost 这个简单的网页为例）查看源代码，发现name属性值为“name”，密码对应的输入框中，name属性值为“pass”。因此构建表单的数据中要包含两个字段，字段名为“name”，“pass”，字段值设…

爬虫 2023年4月11日
000
Python 多线程、线程池、协程爬虫

多线程生产者消费者模型爬虫 import queue import requests from bs4 import BeautifulSoup import threading import time import random def craw(url): r = requests.get(url=url) return r.text def parse…

爬虫 2023年4月10日
000
Python 爬虫实战（一）：使用 requests 和 BeautifulSoup

我之前写的《Python 3 极简教程.pdf》，适合有点编程基础的快速入门，通过该系列文章学习，能够独立完成接口的编写，写写小东西没问题。 requests requests，Python HTTP 请求库，相当于 Android 的 Retrofit，它的功能包括 Keep-Alive 和连接池、Cookie 持久化、内容自动解压、HTTP 代理、SSL…

爬虫 2023年4月10日
000
二十四 Python分布式爬虫打造搜索引擎Scrapy精讲—爬虫和反爬的对抗过程以及策略—scrapy架构源码分析图

1、基本概念 2、反爬虫的目的 3、爬虫和反爬的对抗过程以及策略 scrapy架构源码分析图

爬虫 2023年4月13日
000
Python爬虫实现百度图片自动下载

为了实现Python爬虫自动下载百度图片，我们需要进行以下步骤: 1. 确定需要爬取的图片链接我们在百度图片中搜索我们需要的图片，进入图片详情页后，可在浏览器开发者工具中找到图片链接的url。注意仅选择原图链接。 2. 分析页面结构我们在浏览器开发者工具中可以看到页面的具体结构，可以利用requests模块进行网页爬取，并解析出图片链接。示例一：爬取百…

python 2023年5月14日
000
爬虫（1）selenium头条新闻爬虫抓取

要求： 1、题目、url、作者、相对时间以及评论数量 2、存入mongoDB 3、模拟Chrome下拉异步加载新闻 4、相对时间的转换（1分钟前。。。。。）连接mongoDB，设置数据库名和集合名实例化Chrome，隐式等待5秒，点击科技新闻 execue_script 加载js命令运行，两个循环往下拉下去（这里设定…

爬虫 2023年4月11日
000
Scrapy爬虫框架入门

目录 Scrapy爬虫框架入门 1.Scrapy概述 2.组件 3.数据处理流程 4.安装和使用Scrapy 5.开始爬虫 1. 在items.py文件中定义字段，这些字段用来保存数据，方便后续的操作。 2. 在spiders文件夹中编写自己的爬虫。 3. 运行爬虫 4. 在pipelines.py中完成对数据进行持久化的操作。 5. 修改settings.…

爬虫 2023年4月13日
000
scrapy框架简介和基础应用(python爬虫)

一.什么是scrapy? scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍,所谓的框架就是一个已经被集成了各种功能(高性能异步下载,队列,分布式,持久化等)的具有很强通用性的项目模板,对于框架学习,重点是要学习其框架的特性,各个功能的用法即可. 二.安装　　Linux： pip3 install scrapy 　　Wi…

爬虫 2023年4月13日
000

合作推广

合作推广

返回顶部