介绍
selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器 from selenium import webdriver browser=webdriver.Chrome() browser=webdriver.Firefox() browser=webdriver.PhantomJS() browser=webdriver.Safari() browser=webdriver.Edge()
安装
#安装:selenium+chromedriver pip3 install selenium 下载chromdriver.exe添加环境变量或者放到python安装路径的scripts目录中即可 国内镜像网站地址:http://npm.taobao.org/mirrors/chromedriver 最新的版本去官网找:https://sites.google.com/a/chromium.org/chromedriver/downloads #注意: selenium3默认支持的webdriver是Firfox,而Firefox需要安装geckodriver 下载链接:https://github.com/mozilla/geckodriver/releases
selenium下载 浏览器驱动下载
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:爬虫 selenium+Xpath 爬取动态js页面元素内容 - Python技术站