-
豆瓣图书的超详细爬虫源码,基于Python实现
资源介绍
1、本爬虫是爬取豆瓣网站上的TOP 250 图书信息,相关网址:https://book.douban.com/top250
2、本爬虫用到的模块 有 requests,lxml,time
注:
本程序只作为业余学习,程序中,对于“IndexError: list index out of range”报错,已经做了完美解决。
- 上一篇: 基于Hadoop的商品推荐(老师版)
- 下一篇: Python 爬取豆瓣读书