前言

       很早以前就听说了Python爬虫,但是一直没有去了解;想着先要把一个方面的知识学好再去了解其他新兴的技术。

但是现在项目有需求,要到网上爬取一些信息,然后做数据分析。所以便从零开始学习Python爬虫,如果你也对Python爬虫感兴趣,那么可以跟着我一起学习了解一下!

       闲话就不多说了,下面就开始Python爬虫之路!

       

      首先,Python爬虫,那肯定需要用Python语言来写,那么第一步肯定需要安装Python环境(安装完Python环境后我们才能愉快的写代码)。

1,理解Python环境

   首先,要让电脑认识你写的Python代码,我们需要一个叫编译器(Python中叫解释器)的东西,安装了Python编译器后,我们写的Python代码才能在电脑上运行。那大家可能会问:我们之前写代码,只要安装一个软件就行了,从一开始写C/C++语言用的VC++,后面可能又用了Code Blocks,再到后面基本上都用了Visual Studio(VS)或者Eclipse。在这里说一下,我们安装的软件(VS,Eclipse)叫集成环境(IDE),是为我们写代码提供帮助的;在没有IDE的年代,我们牛逼的程序员都是用记事本来写代码的,然后再通过编译器来编译运行。现在有了IDE,我们可以借助它强大的功能来方便快捷的写代码。那么现在我们可以把Python环境分成两个东西:1,编译器(让代码能运行);2,IDE(辅助我们写代码)。

2,安装Python编译器

         注:Python2 和 Python3有很大差别,建议安装Python3。

         参考网站  

           a,进入官网下载自己电脑操作系统对应的python

         b,下载64位安装程序32位安装程序

       先勾选Add Python 3.5 to PATH(添加环境变量)再点击安装。

     1,Python爬虫环境的安装

         安装完成后,在cmd命令行模式下输入 python 如果有提示符 >>> 则表示安装成功。>>> 表示已经进入到python交互式环境中了,也就可以在里面写python代码了!输入exit()退出到命令行模式。在命令行模式中可以直接用:python  文件名.py  来运行python文件。

3,安装IDE

      Python的IDE有很多种,个人比较喜欢JetBrains公司的PyCharm。

      a,进入JetBrains官网下载PyCharm,建议下载专业版。

      b,在PyCharm使用教程里可以学会一些基本操作。

4,免费激活PyCharm

     安装完专业版的PyCharm后,大家会发现,只有30天的试用期!需要激活才能永久使用,花钱买吗?不存在的!当然有免费破解的方法,下面就来介绍免费的破解方法:

      

  (1) 授权服务器激活

 

     选择License server激活,输入激活码:

 

      http://im.js.cn:8888  http://idea.java.sx/ 

 

       http://xidea.online  不过一般没用!建议使用第二种。

 

  (2) 激活码激活

 

     1,修改hosts文件:

 

       Windows系统的hosts文件路径为:

 

         c:\windows\system32\drivers\etc

 

         将 0.0.0.0 account.jetbrains.com 添加到hosts文件末尾

 

       由于是系统文件,所有一般没有修改权限,因此先把hosts文件复制到桌面->然后修改并保存->覆盖系统文件里的hosts文件。

 

      2,输入激活码:(此激活码有效时间为2019,5,4)

                  

K71U8DBPNE-eyJsaWNlbnNlSWQiOiJLNzFVOERCUE5FIiwibGljZW5zZWVOYW1lIjoibGFuIHl1IiwiYXNzaWduZWVOYW1lIjoiIiwiYXNzaWduZWVFbWFpbCI6IiIsImxpY2Vuc2VSZXN0cmljdGlvbiI6IkZvciBlZHVjYXRpb25hbCB1c2Ugb25seSIsImNoZWNrQ29uY3VycmVudFVzZSI6ZmFsc2UsInByb2R1Y3RzIjpbeyJjb2RlIjoiSUkiLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifSx7ImNvZGUiOiJSUzAiLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifSx7ImNvZGUiOiJXUyIsInBhaWRVcFRvIjoiMjAxOS0wNS0wNCJ9LHsiY29kZSI6IlJEIiwicGFpZFVwVG8iOiIyMDE5LTA1LTA0In0seyJjb2RlIjoiUkMiLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifSx7ImNvZGUiOiJEQyIsInBhaWRVcFRvIjoiMjAxOS0wNS0wNCJ9LHsiY29kZSI6IkRCIiwicGFpZFVwVG8iOiIyMDE5LTA1LTA0In0seyJjb2RlIjoiUk0iLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifSx7ImNvZGUiOiJETSIsInBhaWRVcFRvIjoiMjAxOS0wNS0wNCJ9LHsiY29kZSI6IkFDIiwicGFpZFVwVG8iOiIyMDE5LTA1LTA0In0seyJjb2RlIjoiRFBOIiwicGFpZFVwVG8iOiIyMDE5LTA1LTA0In0seyJjb2RlIjoiR08iLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifSx7ImNvZGUiOiJQUyIsInBhaWRVcFRvIjoiMjAxOS0wNS0wNCJ9LHsiY29kZSI6IkNMIiwicGFpZFVwVG8iOiIyMDE5LTA1LTA0In0seyJjb2RlIjoiUEMiLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifSx7ImNvZGUiOiJSU1UiLCJwYWlkVXBUbyI6IjIwMTktMDUtMDQifV0sImhhc2giOiI4OTA4Mjg5LzAiLCJncmFjZVBlcmlvZERheXMiOjAsImF1dG9Qcm9sb25nYXRlZCI6ZmFsc2UsImlzQXV0b1Byb2xvbmdhdGVkIjpmYWxzZX0=-Owt3/+LdCpedvF0eQ8635yYt0+ZLtCfIHOKzSrx5hBtbKGYRPFDrdgQAK6lJjexl2emLBcUq729K1+ukY9Js0nx1NH09l9Rw4c7k9wUksLl6RWx7Hcdcma1AHolfSp79NynSMZzQQLFohNyjD+dXfXM5GYd2OTHya0zYjTNMmAJuuRsapJMP9F1z7UTpMpLMxS/JaCWdyX6qIs+funJdPF7bjzYAQBvtbz+6SANBgN36gG1B2xHhccTn6WE8vagwwSNuM70egpahcTktoHxI7uS1JGN9gKAr6nbp+8DbFz3a2wd+XoF3nSJb/d2f/6zJR8yJF8AOyb30kwg3zf5cWw==-MIIEPjCCAiagAwIBAgIBBTANBgkqhkiG9w0BAQsFADAYMRYwFAYDVQQDDA1KZXRQcm9maWxlIENBMB4XDTE1MTEwMjA4MjE0OFoXDTE4MTEwMTA4MjE0OFowETEPMA0GA1UEAwwGcHJvZDN5MIIBIjANBgkqhkiG9w0BAQEFAAOCAQ8AMIIBCgKCAQEAxcQkq+zdxlR2mmRYBPzGbUNdMN6OaXiXzxIWtMEkrJMO/5oUfQJbLLuMSMK0QHFmaI37WShyxZcfRCidwXjot4zmNBKnlyHodDij/78TmVqFl8nOeD5+07B8VEaIu7c3E1N+e1doC6wht4I4+IEmtsPAdoaj5WCQVQbrI8KeT8M9VcBIWX7fD0fhexfg3ZRt0xqwMcXGNp3DdJHiO0rCdU+Itv7EmtnSVq9jBG1usMSFvMowR25mju2JcPFp1+I4ZI+FqgR8gyG8oiNDyNEoAbsR3lOpI7grUYSvkB/xVy/VoklPCK2h0f0GJxFjnye8NT1PAywoyl7RmiAVRE/EKwIDAQABo4GZMIGWMAkGA1UdEwQCMAAwHQYDVR0OBBYEFGEpG9oZGcfLMGNBkY7SgHiMGgTcMEgGA1UdIwRBMD+AFKOetkhnQhI2Qb1t4Lm0oFKLl/GzoRykGjAYMRYwFAYDVQQDDA1KZXRQcm9maWxlIENBggkA0myxg7KDeeEwEwYDVR0lBAwwCgYIKwYBBQUHAwEwCwYDVR0PBAQDAgWgMA0GCSqGSIb3DQEBCwUAA4ICAQC9WZuYgQedSuOc5TOUSrRigMw4/+wuC5EtZBfvdl4HT/8vzMW/oUlIP4YCvA0XKyBaCJ2iX+ZCDKoPfiYXiaSiH+HxAPV6J79vvouxKrWg2XV6ShFtPLP+0gPdGq3x9R3+kJbmAm8w+FOdlWqAfJrLvpzMGNeDU14YGXiZ9bVzmIQbwrBA+c/F4tlK/DV07dsNExihqFoibnqDiVNTGombaU2dDup2gwKdL81ua8EIcGNExHe82kjF4zwfadHk3bQVvbfdAwxcDy4xBjs3L4raPLU3yenSzr/OEur1+jfOxnQSmEcMXKXgrAQ9U55gwjcOFKrgOxEdek/Sk1VfOjvS+nuM4eyEruFMfaZHzoQiuw4IqgGc45ohFH0UUyjYcuFxxDSU9lMCv8qdHKm+wnPRb0l9l5vXsCBDuhAGYD6ss+Ga+aDY6f/qXZuUCEUOH3QUNbbCUlviSz6+GiRnt1kA9N2Qachl+2yBfaqUqr8h7Z2gsx5LcIf5kYNsqJ0GavXTVyWh7PYiKX4bs354ZQLUwwa/cG++2+wNWP+HtBhVxMRNTdVhSm38AknZlD+PTAsWGu9GyLmhti2EnVwGybSD2Dxmhxk3IPCkhKAK+pl0eWYGZWG3tJ9mZ7SowcXLWDFAk0lRJnKGFMTggrWjV8GYpw5bq23VmIqqDLgkNzuoog==

  

  (3)破解补丁激活

 

           比较麻烦,但是永久有效,可以根据 参考网站来实现。

 

  完成了上面的步骤,我们就可以愉快的敲代码了,还是老套路,先练习输出一个"Hello Word"。下一篇就正式的开始Python爬虫了!