Python脚本Selenium及页面Web元素定位详解

Python脚本Selenium及页面Web元素定位详解

什么是Selenium?

Selenium是一款常用的Web应用程序测试框架,可以通过自动化的方式进行Web UI测试。Selenium支持多种程序语言,包括Python、Java等,它能够模拟浏览器的运行行为,方便进行测试的效果检查。Selenium在自动化网页测试及Web Scraping方面都有广泛应用。

如何安装Selenium?

Python实现Selenium主要需要安装Selenium和WebDriver两个模块。使用pip安装即可:

pip install selenium

WebDriver需要根据使用的浏览器类型在官网下载相应的驱动程序。比如,Google Chrome浏览器的WebDriver下载链接为https://sites.google.com/chromium.org/driver/downloads。

如何使用Selenium?

1.创建浏览器引擎对象

使用Selenium首先需要创建一个浏览器引擎对象,这可以通过如下代码完成:

from selenium import webdriver

driver = webdriver.Chrome(executable_path='/path/to/chromedriver')

其中Chrome对应的是要使用的浏览器类型,executable_path对应的是浏览器的驱动程序路径。如果已经将执行路径添加到环境变量中,就可以省略executable_path参数。

2.打开网址并操作Web元素

通过以上方式创建好浏览器引擎对象后,就可以使用Selenium对指定的Web页面进行自动化操作。我们可以使用driver.get(url)方法打开一个新的页面,然后使用find_element_by_*等方法查找页面上的Web元素。

假设我们需要访问搜索引擎Google,并搜索Python,以下是使用Selenium实现的示例代码:

from selenium import webdriver

driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
driver.get('https://www.google.com')
search_box = driver.find_element_by_name('q')
search_box.send_keys('Python')
search_box.submit()

其中,find_element_by_name()方法通过页面元素的name属性定位元素,send_keys()方法对元素进行输入操作,submit()方法提交表单。以上代码实现了打开Google,输入Python关键字并进行搜索的过程。

3.定位Web元素

如何准确地定位页面上的Web元素?可以通过以下方式定位:

  • find_element_by_id(id)
  • find_element_by_name(name)
  • find_element_by_xpath(xpath)
  • find_element_by_link_text(link_text)
  • find_element_by_partial_link_text(partial_link_text)
  • find_element_by_tag_name(tag_name)
  • find_element_by_class_name(class_name)
  • find_element_by_css_selector(css_selector)

以百度首页为例,以下是通过Selenium查找百度搜索条目的代码示例:

from selenium import webdriver

driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
driver.get('https://www.baidu.com')
search_box = driver.find_element_by_id('kw')
search_box.send_keys('Python')
search_box.submit()

其中,find_element_by_id()方法根据元素的id属性确定元素,find_element_by_xpath()方法是通过元素的相对位置和标签属性等信息确定。

示例1:使用Selenium实现国际空间站实时追踪

以下示例通过Selenium实现了国际空间站的实时追踪,实现的功能包括获取当前时间、经度、纬度、当前位置、可见天体等信息,然后将这些信息输出到控制台。

from selenium import webdriver
import time

driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
driver.get('https://www.n2yo.com/')

time.sleep(5)  # 加载页面需要一定的时间

driver.execute_script('document.getElementById("lat").value = "22.314202"')  # 设置纬度
driver.execute_script('document.getElementById("lon").value = "113.934036"')  # 设置经度

time.sleep(5)  # 需要一定的时间重新加载

div = driver.find_element_by_id('infoContent')

timeStr = div.find_element_by_id('info-date').text  # 获取时间
latStr = div.find_element_by_id('info-latitude').text  # 获取纬度
lonStr = div.find_element_by_id('info-longitude').text  # 获取经度
posStr = div.find_element_by_id('info-location').text  # 获取位置
seenStr = div.find_element_by_id('info-visibility').text  # 获取可见天体

print('Time:', timeStr)
print('Latitude:', latStr)
print('Longitude:', lonStr)
print('Position:', posStr.strip())
print('Seen:', seenStr.strip())

driver.close()

以上代码中,我们首先通过webdriver对象打开空间站追踪页面,然后设置了站点的经度和纬度信息。接下来,需要等待一定时间,以便页面加载完成。我们通过find_element_by_id()方法查找到包含有实时追踪信息的页面块,从中提取我们需要的信息,并将这些信息打印到控制台上。

示例2:使用Selenium实现微博登录

以下示例通过Selenium模拟登录微博平台,并实现获取当前登录用户的粉丝数。

from selenium import webdriver
import time

driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
driver.get('https://www.weibo.com')

time.sleep(5)

login_btn = driver.find_element_by_xpath('//a[@node-type="loginBtn"]')  # 查找登录按钮
login_btn.click()

time.sleep(5)

email_input = driver.find_element_by_id('loginname')  # 查找邮箱输入框
password_input = driver.find_element_by_name('password')  #查找密码输入框

email_input.clear()  # 清除邮箱输入框
password_input.clear()  # 清除密码输入框

email_input.send_keys('your_email')  # 输入邮箱
password_input.send_keys('your_password')  # 输入密码

time.sleep(2)

login_submit = driver.find_element_by_xpath('//a[@node-type="submitBtn"]')  # 查找登录按钮
login_submit.click()

time.sleep(5)

user_menu = driver.find_element_by_xpath('//a[@node-type="name"]')
user_menu.click()

time.sleep(5)

fans_num = driver.find_element_by_xpath('//strong[@node-type="fans"]')
print('Current user fans:', fans_num.text)

driver.close()

以上代码中,我们首先通过webdriver对象打开微博主页面,然后查找登录按钮,并通过输入框输入邮箱和密码。接下来,我们等待页面加载完毕,然后点击登录按钮进行登录。登录成功后,我们需要查找当前用户粉丝数的对应页面元素,最后将其输出到控制台上。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python脚本Selenium及页面Web元素定位详解 - Python技术站

(0)
上一篇 2023年6月10日
下一篇 2023年6月10日

相关文章

  • UL、LI 无序列表实现纯CSS网站导航菜单

    实现纯CSS网站导航菜单需要使用无序列表(UL)和列表项(LI),将菜单内容放置在列表项中,然后使用CSS样式来控制菜单的呈现。 下面是实现纯CSS网站导航菜单的步骤: 1. 创建无序列表 使用<ul>标签来创建无序列表,将菜单项目放置在每个列表项(<li>)中,如下所示: <ul> <li><a hre…

    css 2023年6月10日
    00
  • 兼容主流浏览器的jQuery+CSS 实现遮罩层的简单代码

    接下来是详细讲解“兼容主流浏览器的jQuery+CSS 实现遮罩层的简单代码”的完整攻略。 首先,需要说明一下遮罩层的概念。遮罩层是一种常见的页面蒙版(或称为遮挡层),一般情况下用于模拟弹窗、广告等强制性消息窗口。我们需要在页面上添加一个遮罩层,通过覆盖整个网页并给予透明度,使得用户无法操作网页内的元素,同时突出弹出的窗口。 接下来,我们来分步骤讲解 jQu…

    css 2023年6月10日
    00
  • jquery图片放大镜效果

    介绍jquery图片放大镜效果需要的技术有HTML,CSS,jQuery,下面是详细的攻略: 一、HTML结构 首先我们需要一个图片容器,还有一个放大镜容器,下面是示例HTML代码: <div class="zoom-box"> <img class="small-img" src="pat…

    css 2023年6月10日
    00
  • JavaScript Navigator对象(浏览器相关对象)

    JavaScript的Navigator对象代表浏览器的导航信息,即浏览器相关的信息,它包含了一些有关浏览器和系统的信息,例如浏览器的名称、版本、语言、操作系统等。可以通过访问一些属性和方法来获取这些信息。下面,将详细讲解Navigator对象并提供代码示例。 1. 属性 (1)appName 描述:返回当前浏览器的名称(不考虑版本号) 代码: consol…

    Web开发基础 2023年3月30日
    00
  • Link 标签 rel=Stylesheet的实际作用

    Link 标签 rel=Stylesheet 是用于在网页中引入 CSS 样式表的标签,它的作用是告诉浏览器这个文件是一个样式表文件,并按照指定方式应用到当前页面。下面是具体的详细攻略。 1. 基本格式 Link 标签可以使用以下格式来定义: <link rel="stylesheet" type="text/css&qu…

    css 2023年6月10日
    00
  • 基于JQuery制作可编辑的表格特效

    下面是基于 jQuery 制作可编辑表格特效的完整攻略。 1. 准备工作 首先,我们需要引入 jQuery 库文件,并创建一个空的 HTML 表格。具体代码如下: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title&g…

    css 2023年6月10日
    00
  • XHTML CSS制作样式风格切换的WEB站点

    下面是详细讲解“XHTML CSS制作样式风格切换的WEB站点”的完整攻略。 1. 准备工作 在开始制作样式风格切换的WEB站点之前,我们需要准备以下工具和素材: 一个文本编辑器,推荐使用Sublime Text、Visual Studio Code等。 一份基础的XHTML代码,可以从模板网站或者自己手写。 一份基础的CSS代码,可以从模板网站或者自己手写…

    css 2023年6月9日
    00
  • CSS3之边框多颜色Border-color属性使用示例

    我会详细讲解CSS3中边框多颜色Border-color属性的使用示例。 什么是Border-color属性 Border-color是CSS属性的一种,它用于设置一个HTML元素的边框颜色。这个属性可以接收1到4个值,分别是上、右、下、左的边框颜色值,如果没有提供所有的颜色值,则使用复合值,即CSS将使用默认颜色重复填充缺失的颜色。 例如,设置所有边框的颜…

    css 2023年6月9日
    00
合作推广
合作推广
分享本页
返回顶部