-
获取豆瓣图书信息采用Python爬虫技术
资源介绍
爬取指定标签List下评分8.5分以上的图书信息,包括书名、作者、评分、简介,并保存到excel,以标签分类,放到不同的sheet中。核心代码:
title= book.find_element_by_xpath('.//a[1]').text #获取书名
zuozhe= book.find_element_by_xpath('.//div[1]').text.split('/',1)[0]
jianjie= book.find_element_by_xpath('.//p[1]').text #获取简介
worksheet.write(i,0,fenshu); #分数写入第i行的第一列
worksheet.write(i,1,title); #书名写入第i行的第二列
worksheet.write(i,2,zuozhe); #作者写入第i行的第三列
worksheet.write(i,3,jianjie); #简介写入第i行的第四列