python beautifulsoup在标签之间查找

2023年4月6日上午1:00 • Python开发

【问题标题】：python beautifulsoup find between tagspython beautifulsoup在标签之间查找
【发布时间】：2023-04-04 20:26:01
【问题描述】：

我正在尝试从网站获取数据。我设法获得了我想要的数据子集

sections = rows.findAll('p')
for section in sections
    print section

这给了我这个：

<p><i>Hello<strong>World</strong></i></p>
<p><strong>Some Text</strong><p>
<p></p>
<p><strong>Monday</strong><p>
<p>section1</p>
<p>section2</p>
<p>section3</p>
<p><strong>Tuesday</strong><p>
<p>section1</p>
<p>section2</p>
<p>section3</p>
<p>section4</p>
<p></p>

我想要的是这个：

Monday
section1
section2
section3
Tuesday
section1
section2
section3
section4

如果 strong 等于我拥有的 dict，我可以获取strong 标签之间的所有 p 标签吗？或者应该怎么解决？

【问题讨论】：

原始 HTML 是什么？这些<p> 在HTML 中的什么位置？也许它们位于一些独特的标签中，您可以使用它来过滤结果 - 即find("some tag", "attributes").find_all("p")
也许切片结果rows.findAll('p')[3:-1]
原来的html很乱但是所有p标签都在一个div里coderows=soup.find('div', attrs={'class': 'box-default top-border '})
你不能显示这个页面的网址吗？
当然。这是页面。它是瑞典语，在我的例子中我试图简化它westmanska.se/dagens-lunch

标签：
python
beautifulsoup
scrape

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python beautifulsoup在标签之间查找 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

如何配置 uwsgi 以使用特定版本的 python？

上一篇 2023年4月6日

Python：如何在新的终端窗口/命令提示符中执行线程？

下一篇 2023年4月6日

python 网页解析器掌握第三方 lxml 扩展库与 xpath 的使用方法

Python网页解析器掌握第三方lxml扩展库与XPath的使用方法在Python中，我们可以使用第三方库lxml和XPath来解析HTML和XML页面。本文将介绍如何使用lxml和XPath实现网页解析，并提供两个示例。步骤1：安装lxml库在使用lxml库之前，我们需要安装它。您可以使用以下命令安装lxml库： pip install lxml 步…

python 2023年5月15日
000
Python使用urllib模块的urlopen超时问题解决方法

什么是urlopen超时问题在使用Python中的urllib模块的urlopen方法打开URL链接时，如果服务器响应时间超过默认的超时时间，那么该方法将会一直阻塞等待直到服务器响应完成，这就是urlopen的超时问题。 urlopen超时问题的解决方法为了解决这个问题，可以使用以下两种方法： 2.1. 设置超时时间参数在调用urlopen方法时，可以…

python 2023年6月3日
000
Python实现矩阵加法和乘法的方法分析

Python实现矩阵加法和乘法的方法分析矩阵在机器学习和数据科学领域是非常常见的数据类型。在Python中，可以使用NumPy库来实现矩阵的加法和乘法。矩阵加法假设有两个矩阵A和B，它们的维度都是m * n。矩阵加法的定义是对应位置的元素相加，因此必须保证这两个矩阵的维度相同。用公式表示为：C(i, j) = A(i, j) + B(i, j)，其中…

python 2023年6月6日
000
python基于openpyxl生成excel文件

下面我将为您详细讲解python基于openpyxl生成excel文件的完整实例教程。准备工作首先，我们需要安装openpyxl模块，可以在命令行中使用以下命令进行安装： pip install openpyxl 创建excel文件接下来，我们可以在Python中使用openpyxl模块来创建Excel文件。下面是一个简单的示例，通过openpyxl创…

python 2023年5月13日
000
Python使用百度翻译开发平台实现英文翻译为中文功能示例

下面是详细讲解“Python使用百度翻译开发平台实现英文翻译为中文功能示例”的完整攻略。简介百度翻译开放平台提供了多种开发语言的API，其中包括了支持Python的API。Python开发者可以通过访问API来实现多种翻译功能。在这里，我们将演示如何使用Python来实现英文翻译为中文的功能。准备工作在你开始编写Python代码之前，必须完成以下准…

python 2023年6月3日
000
在python中使用requests 模拟浏览器发送请求数据的方法

以下是关于在Python中使用requests模拟浏览器发送请求数据的方法的攻略：在Python中使用requests模拟浏览器发送请求数据的方法 requests是Python中一个流行的HTTP库，可以用于向Web服务器发送HTTP请求和接响应。在某些情况下，我们需要模拟浏览器发送请求数据，以便获取完整的响应内容。以下是在Python中使用reques…

python 2023年5月14日
000
Python3解释器知识点总结

Python3解释器知识点总结什么是Python3？ Python3是一门高级编程语言，由荷兰数学和计算机科学研究院的Guido van Rossum在1989年底发明。Python3最新版本是3.9.5，它非常适合初学者学习，同时也是许多企业和互联网公司中重要的编程语言之一。 Python3解释器 Python3解释器是一款执行Python3代码的工具。…

python 2023年5月30日
000
python的程序分支结构用法及说明

下面是关于“Python的程序分支结构用法及说明”的攻略。什么是程序分支结构？程序分支结构指的是程序中包含条件判断的语句，如果满足某个条件，则执行某个操作；如果不满足，则执行其他操作。在Python中，程序分支结构主要有if语句、if-else语句、if-elif-else语句和嵌套if语句等。 if语句 if语句用于在满足某个条件时执行特定的代码块，使…

python 2023年5月30日
000

合作推广

合作推广

返回顶部