当我们访问一个网站时,服务器会返回一个状态码,这个状态码可以告诉我们请求是否成功,是否出现错误等信息。在Python中,我们可以通过requests模块很容易地获取网页状态码。下面详细讲解获取网页状态码的完整攻略。
确定要访问的网页地址
首先,你需要确定要访问的网页地址。可以直接使用URL,或者通过其他方式获取。
导入requests模块
在Python中,我们可以使用requests模块来获取网页状态码。因此,在代码中首先需要导入requests模块。
import requests
发送请求并获取状态码
在使用requests模块获取状态码时,我们需要先发送请求。requests提供了多种发送请求的方法,包括requests.get()
和requests.post()
等。在本例中,我们以requests.get()
为例。
url = 'https://www.baidu.com/'
response = requests.get(url)
在发送请求后,我们可以通过response.status_code
来获取网页状态码。
status_code = response.status_code
print(status_code)
完整的代码如下:
import requests
url = 'https://www.baidu.com/'
response = requests.get(url)
status_code = response.status_code
print(status_code)
上述代码中,我们首先导入requests模块,然后向百度发送了一个get请求,并将响应保存在response变量中。最后,我们通过response.status_code
获取了网页状态码,并打印输出在了控制台中。
示例说明
下面提供两个示例说明,展示如何使用上述方法获取网页状态码。
示例一
我们需要访问一个不存在的网页,以获取404状态码。
import requests
url = 'https://www.baidu.com/notexist'
response = requests.get(url)
status_code = response.status_code
print(status_code)
上述代码中,我们访问了百度的不存在的页面,即https://www.baidu.com/notexist
。由于该页面并不存在,因此我们可以获取404状态码。输出结果为404。
示例二
我们需要验证一个网站是否已经下线。
import requests
url = 'https://www.example.com/'
try:
response = requests.get(url)
if response.status_code == 200:
print('Website is live.')
else:
print(f'Website returned status code: {response.status_code}')
except requests.exceptions.RequestException as e:
print(e)
print('Website is unreachable.')
上述代码中,我们向一个不存在的网站发送请求,如果得到200状态码,则表示该网站仍然在线。否则,我们认为该网站已经下线。
综上所述,以上就是Python获取网页状态码的完整攻略。可以通过requests模块轻松快捷地获取状态码,并且通过状态码得出相应的信息。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python获取网页状态码示例 - Python技术站