-
汇总《用python编写的网络爬虫》源程序
资源介绍
Richard Lawson著,李斌译的《用python写网络爬虫》(人民邮电出版社)一书,是python爬虫的经典之作,书中的程序在https://bitbucket.org/wswp/code/src/都有,开源免费,但是不是很方便一次性下载。
这个压缩包中,除了书中chapter7和chapter8的部分是非.py文件,不是很需要下载,其他章节的出现的所有的程序都在里面(都是网站上的,没有任何改动)
需要注意的是,如果你是在看这本书,有必要下载,如果没有这本书,一般人看起来应该会很费劲
这本书是python2,里面的程序也都是python2,所以python3肯定是需要修改的(如果python3中没有相应的库,都不能运行)
最后一章有Google、Facebook、Gap、宝马官网的真实网站的分析,看看前面几张的技巧是怎样使用的