登录 注册
当前位置:主页 > 资源下载 > 44 > 设计基于Python的网络爬虫

设计基于Python的网络爬虫

  • 更新:2024-05-19 12:31:50
  • 大小:727KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Python - 后端
  • 格式:DOC

资源介绍

以世纪佳缘网为例,思考自己所需要的数据资源,并以此为基础设计自己的爬虫程序。应用python伪装成浏览器自动登陆世纪佳缘网,加入变量打开多个网页。通过python的urllib2函数进行世纪佳缘网源代码的获取。用正则表达式分析源代码,找到所需信息导入excel。连接数据库,将爬下的数据存储在数据库中。