python爬虫（八） requests库之 get请求

2023年4月11日上午4:40 • 爬虫

requests库比urllib库更加方便，包含了很多功能。

1、在使用之前需要先安装pip，在pycharm中打开：

python爬虫（八） requests库之 get请求

写入pip install requests命令，即可下载

在github中有关于requests库的介绍，网址：https://github.com/requests/requests

2、Get请求

response=requests.get("https://www.baidu.com/")

我们要完成在百度的页面获取中国的相关信息，相当于

python爬虫（八） requests库之 get请求

输入中国：

python爬虫（八） requests库之 get请求

用爬虫代码实验实现：

import requests

# wd是在网址中后面的一段
params={
    'wd':'中国'
}

headers={
    'User-Agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"
}
# 这时我们要在这个网址中加入S
response=requests.get("http://www.baidu.com/s",params=params,headers=headers)

with open('baidu.html','w',encoding='utf-8') as fp:
    fp.write(response.content.decode('utf-8'))

python爬虫（八） requests库之 get请求

打开后就是中国的相关信息：

python爬虫（八） requests库之 get请求

3、response.txt和response.content的区别

response.txt是 requests是经response.content解码的字符串，requests会根据自己的猜测来进行解码，有时候会猜测错误，导致乱码。

response.content是直接从网上爬取的数据，没有经过经过任何解码，是bytes类型。

所以最常用的就是：response.content.decode('utf-8')

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python爬虫（八） requests库之 get请求 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

python爬虫（七） mozillacookiejar

上一篇 2023年4月11日

python爬虫（六） Cookie

下一篇 2023年4月11日

一些爬虫中的snippet

1.tornado 一个精简的异步爬虫（来自tornado的demo） #!/usr/bin/env python import time from datetime import timedelta try: from HTMLParser import HTMLParser from urlparse import urljoin, urldefrag …

爬虫 2023年4月8日
000
scrapy爬虫框架

0x00 scrapy爬虫框架 scrapy库的安装：可以直接使用pip install scrapy来安装，如果IDE是pycharm的话参考之前requests库的安装 scrapy爬虫框架结构： scrapy采用5+2的结构，五个主要模块加上两个中间键详细介绍一下各个组件：引擎(Engine)用来处理整个系统的数据流, 触发事务(框架核心) …

爬虫 2023年4月13日
000
你会使用python爬虫抓取弹幕吗

当然！以下是使用Python爬虫抓取弹幕的攻略。准备工作在使用Python爬虫之前，需要准备以下工具和库： Python 3 – 本教程基于 Python 3.7.3 版本 requests库 – 用于发送 HTTP 请求 BeautifulSoup库 – 用于解析 HTML 如果你没有安装过Python及相关库，请先安装。爬取弹幕步骤以下是使用 P…

python 2023年5月14日
000
python-爬虫

概述 1.什么是爬虫爬虫，即网络爬虫，大家可以理解为在网络上爬行的一直蜘蛛，互联网就比作一张大网，而爬虫便是在这张网上爬来爬去的蜘蛛咯，如果它遇到资源，那么它就会抓取下来。想抓取什么？这个由你来控制它咯。比如它在抓取一个网页，在这个网中他发现了一条道路，其实就是指向网页的超链接，那么它就可以爬到另一张网上来获取数据。这样，整个连在一起的大网对这之蜘蛛来说…

爬虫 2023年4月13日
000
python爬虫爬取淘宝商品比价(附淘宝反爬虫机制解决小办法)

下面是详细讲解“python爬虫爬取淘宝商品比价(附淘宝反爬虫机制解决小办法)”的攻略。 1. 准备工作在开始之前，我们需要先准备好以下工具和库： Python3.x环境 Chrome浏览器 Chrome浏览器驱动：根据自己使用的Chrome版本下载对应的驱动 requests、selenium、pyquery等Python库 2. 分析网页结构在使用P…

python 2023年5月14日
000
Python爬虫突破反爬虫机制知识点总结

Python爬虫突破反爬虫机制知识点总结 1. 基础知识点在进行Python爬虫时，我们需要掌握一些基础知识点，以便更好的理解反爬虫机制的原理和应对方法。这些基础知识点包括： 1.1 HTTP协议 HTTP协议是爬虫的基础，我们需要理解HTTP协议的请求方法、请求头和响应等内容。常见的HTTP请求方法有GET和POST方法，请求头中的User-Agent、…

python 2023年5月14日
000
腾讯视频信息数据爬虫开发【核心爬虫代码】

腾讯视频信息数据爬取程序代码【笔记】 # -*- coding: utf-8 -*- import scrapy from ..items import TencentItem,CommentItem import re,requests,json class TencentSpiderSpider(scrapy.Spider): name = …

爬虫 2023年4月11日
000
Python爬虫b站视频弹幕并生成词云图分析

爬虫：requests，beautifulsoup 词云：wordcloud，jieba 代码加注释： 1 # -*- coding: utf-8 -*- 2 import xlrd#读取excel 3 import xlwt#写入excel 4 import requests 5 import linecache 6 import wordcloud 7 …

爬虫 2023年4月11日
000

合作推广

合作推广

返回顶部