登录 注册
当前位置:主页 > 资源下载 > 44 > 新浪微博爬虫代码及其实现结

新浪微博爬虫代码及其实现结

  • 更新:2024-09-12 20:27:20
  • 大小:111KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Python - 后端
  • 格式:RAR

资源介绍

新浪爬虫的python代码以及部分结果整理 文件列表 1. spider_try.py 爬虫主程序,采用抓取html源码解析的方式获取用户信息。针对每个用户按照person类定义解析。 2. person.py 定义person类,将相应的html标签段解析为可读形式 3. format.py 将最终的结果输出为gexf标准格式方便图处理