《实战Python网络爬虫》- 感想

端午节假期过了，之前一直在做出行准备，后面旅游完又休息了一下，最近才恢复状态。

端午假期最后一天收到一个快递，回去打开，发现是微信抽奖中的一本书，黄永祥的《实战Python网络爬虫》。

去各大网站搜了一下这个人，没有名气，去网购平台看了他别的书的书评，整体来说，书都是拼凑的。。。

但是既然书到手了，不妨翻开看看，刚好最近没有什么头绪，又偏头痛。花了几个半天整体翻了一下这本书，感觉是有点浅显的。

我之前用java写过爬虫，感觉比较难的还是反爬虫这块。这本书，我先看了第一个实战项目，51job的，运行了代码之后发现，哦，好吧，这个网站，貌似没有反爬虫机制？

其实具体的爬取内容的方法各个网站也是差不多的。主要还是反爬虫这块。但是书上内容不多，只有一个章节。

个人觉得，对于爬虫新手，看一看每章的小结，还是很能增长一些见识的。更深入的技术，大概这本书是不能提供的。

后续有时间，我大概会摘录一些小结放到这里来吧~虽然没什么人看这里。

定义：自动抓取网络信息

分类：

requests_cache.install_cache(backend='memory')

存储机制：

并发库concurrent.futures：ThreadPoolExecutor和ProcessPoolExecutor

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：《实战Python网络爬虫》- 感想 - Python技术站