- -- 目标:针对医院有些医生有预约号不确定时间点有号,晚了就挂不到了,能有个监测爬去,有号就提醒的机制。
可能会用到:scrapy + PhantomJS + Selenium
环境: windows10 + vs 2015 + python 2.7
安装 : scrapy
创建项目: 命令提示符 界面 使用语句 scrapy startproject s_scrapy
成功后会提示创建的目录地址
cd s_scrapy
进入目录
tree /f
树形结构读取目录文件
在vs中创建一个python的项目,再增加现有文件s_scrapy到项目中,这样所有的项目文件都导入了,方便操作
下载PhantomJS ,Windows环境下载好后,解压得到PhantomJS.exe
放到cmd可以执行的路径下面,再通过cmd 执行语句phantomjs ./test.js http://baidu.com
当然了./test.js 路径要对,可以自己改
-- python 2.7 安装selenium 目的是为了调用PhantomJS 这种没有界面的浏览器,来实现交互功能
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:20171012 动态爬虫爬取预约挂号有号信息 - Python技术站