登录 注册
当前位置:主页 > 资源下载 > 5 > 学习Python基础知识的一种方式是通过使用njit-course-scraper构建页面抓取器,从HTTP中提取课程数据

学习Python基础知识的一种方式是通过使用njit-course-scraper构建页面抓取器,从HTTP中提取课程数据

  • 更新:2024-07-04 14:20:38
  • 大小:5KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

NJIT课程页面抓取器 为了使自己熟悉Python,我为NJIT的课程表编写了页面抓取工具。 到目前为止,其中两个已经启动并运行: history.py提取了2000年到2014年的历史数据scrape.py提取了活跃学期的所有课程数据。 在运行之前,请在终端中执行以下命令: pip install --upgrade pip pip install lxml pip install requests 下面是用于存储历史数据和活动数据的表的架构。 您可以微调varchar的大小,但我只是将它们设置为255,以解决文本中存在大量空格的特殊情况。 CREATE TABLE courses ( id int ( 11 ) AUTO_INCREMENT, number varchar ( 255 ), name varchar ( 255 ), sect varchar ( 25