资源介绍
a-little-spider
此文件共两个项目,demo2和spider。demo2是我维护博客过程中帮助自己减轻工作量而写的一个爬虫程序,spider项目为python爬虫的一个小练习。
demo2
由于我的****博客和liuchuo.net博客上有一些代码并不对应,所以写了一个爬虫查找所有不对应的博客文章并输出markdown表格。
主要功能:
爬取****上所有PAT甲级的文章,并将结果返回在item_list
爬取liuchuo.net上所有PAT甲级的文章,并将结果返回在item_dict
获取****博客上所有PAT甲级文章的代码片段,并将代码中的空格去除
获取liuchuo.net上所有PAT甲级文章的代码片段,并将代码中的空格去除
比较****和liuchuo.net的代码,将代码不相同的文章列表用markdown语法以表格的形式输出到outpud.md文件中
(乙级同