Python lxml模块的基本使用方法分析

简介

Python lxml是一个基于Python libxml2/libxslt库的优秀的XML处理库，它提供了一种简单、易用、高效的方式来处理XML文件，支持XPath、解析器、HTML解析等多种功能。本文将介绍Python lxml的基本使用方法，以帮助开发者加深对Python lxml的理解和应用。

安装Python lxml

首先，需要安装Python lxml，可以通过pip进行安装：

pip install lxml

解析XML文件

下面看一个解析XML文件的示例：

from lxml import etree

xml_string = """
<bookstore>
  <book category="COOKING">
    <title lang="en">Everyday Italian</title>
    <author>Giada De Laurentiis</author>
    <year>2005</year>
    <price>30.00</price>
  </book>
</bookstore>
"""

root = etree.fromstring(xml_string)

for element in root.iter():
  print("%s - %s" % (element.tag, element.text))

这里需要注意的是，etree.fromstring可以通过传递一个字符串来解析XML，也可以通过传递一个文件路径来解析本地文件：

root = etree.parse("file.xml")

XPath查询

XPath是一种可以在XML文档中查找节点和内容的语言，Python lxml提供了一个XPath模块来查询XML中的数据。下面看一个XPath查询的示例：

from lxml import etree

xml_string = """
<bookstore>
  <book category="COOKING">
    <title lang="en">Everyday Italian</title>
    <author>Giada De Laurentiis</author>
    <year>2005</year>
    <price>30.00</price>
  </book>
  <book category="CHILDREN">
    <title lang="en">Harry Potter</title>
    <author>J K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
</bookstore>
"""

root = etree.fromstring(xml_string)

# 查询所有图书标题
titles = root.xpath("//book/title/text()")

# 查询一类图书
category = "COOKING"
books = root.xpath("//book[@category='%s']" % category)

for book in books:
  title = book.xpath("title/text()")[0]
  author = book.xpath("author/text()")[0]
  year = book.xpath("year/text()")[0]
  price = book.xpath("price/text()")[0]
  print("%s by %s, published in %s, costs $%s" % (title, author, year, price))

输出结果为：

Everyday Italian by Giada De Laurentiis, published in 2005, costs $30.00

从示例中可以看出，XPath查询是非常灵活且强大的，我们可以通过该模块来极简方式地获取XML文档中的数据。

结语

Python lxml是一个强大的XML处理库，它提供了多种功能来操作XML文档，如解析、生成、XPath查询等。本文介绍了Python lxml的基本使用方法，希望可以帮助开发者更好地使用该库。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python lxml模块的基本使用方法分析 - Python技术站

Python lxml模块的基本使用方法分析

Python lxml模块的基本使用方法分析

简介

安装Python lxml

解析XML文件

XPath查询

结语

相关文章