学习于:http://cuiqingcai.com/1319.html

用到的方法是 soup.select(),返回类型是 list,用 get_text() 方法来获取它的内容

 

(1)通过标签名查找

print soup.select('title'print soup.select('a')

print soup.select('b')

 

(2)通过类名查找

print soup.select('.sister')

 

(3)通过 id 名查找

print soup.select('#link1')

 

(4)组合查找

#查找 p 标签中,id 等于 link1的内容

print soup.select('p #link1')
#直接子标签查找

print soup.select("head > title")

 

(5)属性查找

#class=“sister”的a标签

print soup.select('a[class="sister"]')
print soup.select('p a[href="http://example.com/elsie"]')