登录 注册
当前位置:主页 > 资源下载 > 49 > 获取单个博主的所有博文 using Python

获取单个博主的所有博文 using Python

  • 更新:2024-09-12 20:53:14
  • 大小:3KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Python - 后端
  • 格式:PY

资源介绍

python+urllib+selenium爬取****单个博主的所有博文。步骤: 1.通过selenium获取js动态加载的页数 页数是javascript动态加载,不能直接通过urllib获取。改为通过selenium获取页数。 2.通过urllib获取一页内所有文章的链接 根据页数、链接,获取每一页的文章链接,存入数组。 3.遍历文章链接,获取对应的文章的html文件,写好标题存储起来 请自行阅读代码修改食用