抓取网站时缺少 HTML 元素。 Python

2023年4月8日下午12:14 • Python开发

【问题标题】：Missing HTML Elements when scraping website. Python抓取网站时缺少 HTML 元素。 Python
【发布时间】：2023-04-01 00:21:02
【问题描述】：

我正在尝试使用 bs4 和 Selenium 从网站中提取 HREF。但是，当我使用 Beautiful Soup 解析 HTML 时，我正在寻找的元素会丢失。当我稍后尝试搜索它们时，我只会得到 NoneType 对象。
以下是我想删除的内容：

我正在使用以下代码快速解析：

my_url = browser.current_url
uClient = uReq(my_url) 
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")

但是当我跑步时：

squeeps = page_soup.findAll("div",{'id':'pcisBody'})
squeeps[0]

这就是我得到的全部：

<div id="pcisBody">
<img alt="loading" height="40" src="/OnlineServices/Images/loading.gif" width="40"/>
<span id="pcisLoading">Retrieving Data...</span>
</div>

任何帮助将不胜感激！！这是链接：https://www.ladbsservices2.lacity.org/OnlineServices/PermitReport/PermitResults/444952

【问题讨论】：

您需要使用 Selenium 获取网站的 page_source 并将其内容传递给 BS4。
请分享链接
@MendelG ladbsservices2.lacity.org/OnlineServices/PermitReport/…

标签：
python
html
selenium
web-scraping
beautifulsoup

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：抓取网站时缺少 HTML 元素。 Python - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Python 查找所有子孙

上一篇 2023年4月8日

Anaconda 中的 Python 3.X 还是 Python 2.7？

下一篇 2023年4月8日

Python中元组的概念及应用小结

Python中元组的概念及应用小结什么是元组元组（tuple）是一种有序的不可变序列类型，它可以用来存储一组数据，一旦创建就无法修改。元组使用小括号 () 来表示，可以包含任意类型的数据，包括数字、字符串、列表、字典、甚至是另一个元组。创建元组创建元组非常简单，只需使用一对小括号 () ，将多个数据用逗号 , 隔开即可，如下所示： # 创建一个包含多…

python 2023年5月14日
000
Python中collections.Counter()的具体使用

针对“Python中collections.Counter()的具体使用”，我来为大家撰写一份详细的攻略。什么是collections.Counter()？我们知道，在Python中，内置的简单数据类型有列表、元组、字典、集合等，但在处理数据时，有时也会用到比较专业的数据类型，collections.Counter() 就是其中之一。 collectio…

python 2023年5月14日
000
python二分法查找实例代码

以下是关于“Python二分法查找实例代码”的完整攻略：简介二分法查找是一种常用的查找算法，它通过将有序数组分成两部分，每次查找可以将查找范围缩小一半，从而快速定位目标元素。在本教程中，我们将介绍如何使用Python实现二分法查找，并提供两个示例说明。实现二分法查找以下是使用Python实现二分法查找的代码： def binary_search(ar…

python 2023年5月14日
000
pandas读取csv格式数据时header参数设置方法

pandas是Python中常用的数据处理库之一，可以用来读取各种不同格式的数据。当我们读取csv格式的数据时，常常会涉及到如何设置header参数，以正确处理数据文件中的列名信息。下面是pandas读取csv格式数据时header参数设置的完整攻略，包含以下几个步骤：步骤1：导入pandas库在开始之前，我们需要先导入pandas库。代码如下： im…

python 2023年5月13日
000
Python 使用 prettytable 库打印表格美化输出功能

Python是一种功能强大的编程语言，广泛应用于数据处理、机器学习、人工智能等领域。在进行数据处理时，我们经常需要将数据以表格的形式展示出来，同时还要考虑表格的美观性和易读性。而使用Python的prettytable库可以方便地实现对表格的美化输出。下面就是详细的攻略：什么是prettytable库 prettytable库是Python的一个第三方库…

python 2023年6月5日
000
Python数字图像处理代数之加减乘运算

Python数字图像处理代数之加减乘运算在数字图像处理中，对图像进行代数运算可以实现许多有用的功能。Python作为一种高级编程语言，拥有丰富的科学计算和图像处理库，可以方便地进行数字图像处理代数运算。本文将介绍Python数字图像处理代数之加减乘运算的完整攻略，包括如何完成这些运算以及代码示例。图像加法运算图像加法运算可以在两幅图像之间进行，将对应…

python 2023年5月19日
000
python 基于DDT实现数据驱动测试

python基于DDT实现数据驱动测试数据驱动测试是指用数据来推动测试执行，高效地测试大量不同的数据组合和多样化场景。在测试中，我们需要构建复杂数据结构，去测试不同条件下的代码正确性或者服务功能是否正确。而这就需要针对不同情况运行测试，数据驱动测试的方式，就可以有效地解决这些问题。 Python是一种简单易学但十分强大的编程语言，因其简洁优雅、易读易写、开…

python 2023年5月13日
000
python3读取excel文件只提取某些行某些列的值方法

针对“python3读取excel文件只提取某些行某些列的值方法”的问题，我为您提供以下完整攻略： 1. 安装依赖库使用Python读写Excel需要依赖第三方库openpyxl和pandas，您需要确保已经安装它们。如果您正在使用anaconda，可以通过以下命令进行安装： conda install openpyxl pandas 如果您没有使用ana…

python 2023年6月5日
000

合作推广

合作推广

返回顶部