当前位置:
主页
>
资源下载 >
10 > CSDN-spider用于抓取CSDN平台上的博客文章
-
CSDN-spider用于抓取CSDN平台上的博客文章
-
更新:2024-08-06 16:18:02
-
大小:3KB
-
推荐:★★★★★
-
来源:网友上传分享
-
类别:其它 - 开发技术
-
格式:ZIP
资源介绍
基于Python的Csdn博客爬虫(多线程)
说明
爬取Csdn某个博主的所有博文,并下载到本地(暂时只支持保存html格式),加入了多线程,爬取更快速。
SpiderGui----------------->爬虫gui界面
CsdnBlogSpider------------>爬虫主程序
环境
Python3.4
运行
* 确保安装Python解释器。
* SpiderGui.py
* 提示输入要爬取的博客名和开启线程数,根据自己需求配置
* 开始爬取,存储在当前目录的blog文件夹下
存在问题
本爬虫还不够完善,欢迎大家指导