以下是关于Python中requests库+xpath+lxml简单使用的攻略:
Python中requests库+xpath+lxml简单使用
在Python中,可以使用requests库、xpath和lxml库进行网页解析。是Python中requests库+xpath+lxml简单使用的攻略。
使用requests库获取网页内容
使用requests库可以轻松获取网页内容。以下是使用requests库获取网页内容的示例:
import requests
url = 'https://www.example.com'
response = requests.get(url)
print(response.text)
在上面的示例中,我们使用requests库发送了一个GET请求到https://www.example.com,并使用text属性获取响应内容。
使用xpath和lxml库解析网页内容
使用xpath和lxml库可以轻松解析网页内容。以下是使用xpath和lxml库解析网页内容的示例:
import requests
from lxml import etree
url = 'https://www.example.com'
response = requests.get(url)
html = etree.HTML(response.text)
title = html.xpath('//title/text()')[0]
print(title)
在上面的示例中,我们使用requests库发送了一个GET请求到https://www.example.com,并使用etree.HTML方法将响应内容转换为HTML对象。然后,我们使用xpath方法获取网页标题,并使用text()方法获取标题文本内容。
使用xpath和lxml库解析XML内容
使用xpath和lxml库也可以轻松解析XML内容。以下是使用xpath和lxml库解析XML内容的示例:
import requests
from lxml import etree
url = 'https://www.example.com/api/users'
response = requests.get(url)
xml = etree.XML(response.text)
name = xml.xpath('//user/name/text()')[0]
email = xml.xpath('//user/email/text()')[0]
print(name, email)
在上面的示例中,我们使用requests库发送了一个GET请求到https://www.example.com/api/users,并使用etree.XML方法将响应内容转换为XML对象。然后,我们使用xpath方法获取XML节点,并使用text()方法获取节点文本内容。
以上是Python中requests库+xpath+lxml简单使用的攻略,希望对您有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python中requests库+xpath+lxml简单使用 - Python技术站