获取IP归属地等信息是网络爬虫开发中常用的技术之一。Python是一种简单易用的编程语言,也有许多强大的第三方模块可以用于网络爬虫开发。本文将为大家介绍如何使用Python实现获取IP归属地等信息的完整攻略。
步骤一:引入所需模块
首先,我们需要引入用于实现这一功能的第三方模块——"Requests" 和 "BeautifulSoup4" 。"Requests"模块可以访问 Web 内容而"BeautifulSoup4"则能解析 HTML。
import requests
from bs4 import BeautifulSoup
我们还需要定一个IP地址和查询网站URL,此处以“https://ip.chinaz.com/”为例。
ip=input("请输入IP地址:")
query_url="https://ip.chinaz.com/"+ip
步骤二:发送请求并解析
我们使用 "Requests" 发送请求,将页面内容存储在一个变量中。然后,我们使用 "BeautifulSoup4" 将这个变量转换为 BeautifulSoup 对象。最后,我们就可以根据标签名称、类名、 ID 等等来检索我们所需要的信息,并把它们显示出来。
response = requests.get(query_url) #发送请求并获取HTML页面
soup = BeautifulSoup(response.text, 'html.parser') #解析HTML页面
result=soup.find_all('span',{"class":"Whwtdhalf w80p"}) #获取IP地址的归属地
这里我们使用 soup.find_all('span',{"class":"Whwtdhalf w80p"})
来获取 IP 地址的归属地,因为这个标签拥有 class 为 "Whwtdhalf w80p"。
步骤三:输出结果
for item in result:
print(item.string)
将以上查询方法组合起来后,完整代码如下:
import requests
from bs4 import BeautifulSoup
ip=input("请输入IP地址:")
query_url="https://ip.chinaz.com/"+ip
response = requests.get(query_url) #发送请求并获取HTML页面
soup = BeautifulSoup(response.text, 'html.parser') #解析HTML页面
result=soup.find_all('span',{"class":"Whwtdhalf w80p"}) #获取IP地址的归属地
for item in result:
print(item.string)
下面我们将进行两个示例,分别查询 iP 地址为 202.194.138.5 和 8.8.8.8 的 IP 地址归属地。
import requests
from bs4 import BeautifulSoup
# 通过输入查询
ip=input("请输入IP地址:")
# 查询 202.194.138.5 的归属地
query_url="https://ip.chinaz.com/"+ip
response = requests.get(query_url)
soup = BeautifulSoup(response.text, 'html.parser')
result=soup.find_all('span',{"class":"Whwtdhalf w80p"})
for item in result:
print(item.string)
#查询 8.8.8.8 的归属地
query_url="https://ip.chinaz.com/"+ip
response = requests.get(query_url)
soup = BeautifulSoup(response.text, 'html.parser')
result=soup.find_all('span',{"class":"Whwtdhalf w80p"})
for item in result:
print(item.string)
以上就是如何基于 Python 实现获取 IP 归属地等信息的完整攻略,其中涉及到了 "Requests" 和 "BeautifulSoup4" 两个库的使用,通过解析 HTML 页面的方式获取网站上的信息。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python实现获取Ip归属地等信息 - Python技术站